您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [北航人文高研院&清华新闻与传播学院]:大模型工具大全:一次看遍各个领域的AI利器 - 发现报告

大模型工具大全:一次看遍各个领域的AI利器

报告封面

北京航空航天大学29系人文与社会科学高等研究院清华大学新闻与传播学院、人工智能学院双聘教授@新媒沈阳团队 何静(副教授) (一篇科普报告每多一个公式读者数量就减半。该报告仅用于科普,面向对象为小白。) 主流通用语言模型 ChatGPT DeepSeek Kimi OpenAI开发的AI助手,具备强大的通用对话能力,广泛的知识面覆盖和庞大用户基础定位为通用生产力工具。特色是作为“一体化”AI系统,能自动调度子模型处理复杂任务,在编程、创意写作和健康咨询方面表现突出。https://chat.openai.com/ Google推出,依靠原生全模态能力,可以无缝理解和处理文本、图像、音频视频等多种信息,处于第一梯队支持长文本token,推理编码能力也是独一档的存在,能根据用户需求动态生成交互式工具界面https://gemini.google.com 阿里巴巴推出,从API到QWEN-2系列高性价比,很多蒸馏小模型也都是用通义千问当底座可以听说读写、绘画指导、分析环境甚至导航,而推理模型QWQ则能解决大部分场景的推理难题 月之暗面开发,主打针对长文本、代码库的上下文处理能力以及探索版的信息搜索整合能力16B轻量级开源多模态模型,在低成本前提下,支持超高分辨率输入128K上下文,还有不错的数学推理能力https://www.kimi.com/ 以极低的训练和部署成本,高效开源的训练方法,打破了中文大模型面临的数据与算力困境推理模型R1直接打破了语料桎梏,堪称中小开发者的福音 https://www.deepseek.com/ https://www.qianwen.com/ 智谱清言 腾讯元宝 豆包 双模态随意切换,深度整合腾讯自有内容池,能直接处理来自微信聊天、公众号的信息能接续数据库搭建,可以完成一站式工作流,兼顾深度思考与快速生成,擅长编程、数学推理和长文本处理https://yuanbao.tencent.com/ 擅长数学、物理等理工科相关领域以及数据分析类的工作,长文档解读也可圈可点开源免费,沉思AutoGLM更适合做专业的研究报告https://www.zhipuai.cn/ 在长文本理解和生成复杂推理方面表现出色,特别是英文能力非常强在编码、推理和长期记忆方面能力突出,旗舰版本可支持智能体长时间稳定执行复杂任务https://claude.com/ 由xAI公司开发,对话有一定的叛逆感,回答时容易放飞自我免费但是有使用限额,伦理限制比其他AI都低很多,能 实 时 访 问X平 台 ( 原Twitter)信息进行回答https://grok.x.ai 字节跳动推出,产品调性不那么严肃,情绪表达更自然,对刚接触AI产品的用户非常友好集成超能创意生图、视频解析等场景化功能,并深度融入字节的软硬件生态https://www.doubao.com/chat/ AI提示词工具 专注于品牌视觉与印刷物料的AI设计平台,用户可快速生成海报、T-恤图案、名片、社媒图片等内置大量字体、矢量图、风格模板,AI功能支持生成图形、抽象背景、样式迁移,亦能快速去背景与处理细节https://promptperfect.jina.ai 免费的提示词生成工具,无需登录,可用于生成或优化适 用 于 多 个 模 型 ( 如C h a t G P T、C l a u d e、Gemini)提示词快速、免费、简单,非常适合试用/快节奏场景适用场景:你想马上得到可用提示词,用于实验/临时项目/快速迭代http://seotabriz.com 输入你要做的事情(如“写博客”、“生成图像”),工具自动生成适配提示词。支持多种AI模型入门门槛低,适合刚开始使用AI或提示词还不熟练的用户https://www.junia.ai 一个提示词管理+库平台,社区用户可以上传、分享、使用各种分类(如市场营销、SEO、客服、产品文案)提示资源丰富、可直接拿来用,也可稍作修改适配你的需求https://www.aiprm.com 不仅帮助生成提示词,还支持调优、评估、版本管理、批量生成,覆盖从「想法→提示词→模型执行」整个流程用户可以建立评测数据集、查看“bad case”、版本迭代,有助于提升提示词质量和输出效果可控性https://promptpilot.volcengine.com/home 用户可以同时输入多个不同的prompt,快速看到哪一种提示词结构、措辞、模型选择效果更好支持切换模型版本、模型提供商,从而进行“这个提示词 用G P T - 4效 果v s用Mistral效果”的对比https://promptoctopus.com/ 专注于“提示词+智能体”生成与管理,平台提供中文界面,用户可以发现、构建、分享提示词聚焦于“提示词仓库”式管理,帮助用户保存自己的中文提示词、按任务分类、分享给他人https://www.aishort.top/ 专注于视觉生成(Text-to-Image)提示构建的优秀工具适合使用Midjourney的用户,便于快速生成结构化提示词、降低门槛、加速视觉创作流程https://www.imiprompt.com/ AI绘图工具 Stable Diffusion Leonardo.Ai Midjourny Bing Image Creator 开源的底层AI图像生成模型,为开发者、研究者和高级用户提供了极高的自由度可以生成非常逼真的图像。支持多种图像样式和特效,用户可以根据需要进行选择作为核心算法,可被集成到各类工具中,实现文生图、图生图、视频生成等功能https://stablediffusionweb.com 微软推出的大众化免费AI绘图工具,集成在Bing搜索和Edge浏览器中,旨在降低使用门槛基于DALL·E 3/GPT-4o模型,适合日常快速创意和初学者输入文字描述(支持中文),快速生成图像;可基于上传的图片进行修改或二次创作https://www.bing.com/create 面向专业创意工作者的高质量AI艺术生成平台基于文本生成高质量图像与视频;提供AI画布编辑、3D纹理生成、一键抠图等专业工具以超写实输出和精细控制著称,支持用户训练自己的定制模型,在特定风格上表现优异https://leonardo.ai 经典选择 Emu Edit NanoBanana 功能有文生图、AI pattern、LogoIllustration及AI模型训练等具备实时生成功能,根据画板内容变化,AI会快速生成对应的新图像,形成接近实时的画面涂鸦重绘体验,目前在内部测试中绘画工具操作非常方便,可一键切换风格,满足用户设计需求https://krea-ai.com DALL·E更强大的用户语言推理,不需要用户自己掌握复杂的Prompt编写知识,使用起来门槛更低ChatGPTPlus和Enterprise用户都可一键使用绘画质量大幅提升,可根据细微语义区别进行调整https://openai.com/dall-e-3 前沿创新 AI综合视觉工具综合绘图 剪映旗下产品,支持通过自然语言及图片输入,生成高质量的图像及视频,可应用于短视频内容制作、电影制作等多种场景提供故事创作模式,支持一站式生成故事https://jimeng.jianying.com/ 国内MiniMax公司开发,目前是全球增速最快的AI视频工具之一。支持复杂物理运动(爆炸、流体),内置运镜模组https://hailuoai.com/ 多模态一体化创意生产力工具集成视频内容编辑、风格重绘、镜头延展等多种任务,可一次性生成带语音、音效的视频https://app.klingai.com/cn/ 支持多种风格(如怀旧日漫、厚涂、赛博朋克、写实、卡通等)和图生图、局部重绘、人脸修复等二次创作功能平台支持AI绘画,还支持将绘画或文字提示扩展为视频内容,适合制作动态视觉资产https://d.design/ 元镜由ZeeLin推出,支持图、文、音、视频等多模态输入,结合AI智能体协作,生成高质量成片一句话生成可编辑视频,支持剧本驱动、画面风格自选、旁白自动生成,几分钟生成高质量内容https://yuanjing.zeelin.cn/ 具备更真实的物理运动、连贯的镜头语言、同步的语音与音效,效果更快、更真实、更具导演感https://openai.com/es-419/sora/ 支持视频元素修改、风格转换、添加音效与口型同步等深度编辑;提供镜头控制和关键帧过渡等创意工具https://www.pika.fr/ 能够从简单的文字描述中生成高清视频和动画,可生成高清、16:9电影质量的视频,能选择超现实主义、动漫等不同风格https://moonvalley.me/ 能够精准调控视频元素,具备电影镜头质感;保真度、一致性、运动性显著提升https://runwayml.com 是Google DeepMind推出的“文本/图像提示→高保真视频+原生音频(对话、音效、环境声)生成模型”https://aistudio.google.com 基于扩散模型,采用“文生图——图生视频”两步法,通过分解步骤提升生成质量;在对文本的忠实度方面表现突出,技术路线清晰https://emu-video.metademolab.com/ 由生数科技联合清华大学研发,是中国首个长时长、高一致性的视频大模型。多主体一致性技术领先,成本低至1秒4分钱https://vidu-china.com/ 侧重社交娱乐应用,侧重趣味性和个性化表达;利用AI将文字或表情符号转化为场景,对照片进行风格化重塑;提供海量头像和风格模板https://plaiday.io/ AI变美工具 专业级AI人像精修软件,专为商业摄影行业设计。软件用美图自研的先进AI算法,提供一键式全自动修图功能支持RAW格式转换、批量处理、智能精修和丰富预设,能够快速实现人像美化、背景替换和风格化处理https://yunxiu.meitu.com/home 人像板块提供美颜、美妆、面部重塑等功能,支持自动与手动调节参数能一键美白磨皮,更能对五官、脸型、妆容、发丝进行精细化调整。保留皮肤质感,告别“假面感”,在电脑上轻松实现专业级的人像精修https://www.retouchpics.com/ 专业的AI图片处理软件,旨在为摄影师和摄影爱好者提供高效、智能、便捷的照片处理解决方案提供AI美颜功能,保证美肤同时保留自然肌理,可精准液化脸部轮廓,并支持性别、年龄识别,优化脸部比例https://www.aixtsy.com/black_light 依托多项独家AI技术,帮助商业摄影从业者高质高效完成色彩、人像、图像等后期精修工作可进行中性灰磨皮、AI全身美型、骨骼点精细化美型、AI背景修复。支持自定义预设效果,并批量应用到全部图片https://www.pixcakeai.com/ ON1 Portrait Al 美型、幕布处理以及自动换天空等,专业人像修图工具,自动识别和分析照片中的人脸,精准调整肤色、光影和细节,处理效果细腻自然,,适合打造精致人像作品与Lightroom和Photoshop无缝集成:方便在已有工作流中直接使用Portrait AI的强大功能,提升工作效率https://www.on1.com/products/portrait-ai/ 商业级AI精修软件,广泛应用于人像摄影和图像处理领域提供从皮肤修饰到全身智能液化的全方位修图功能。其特点包括皮肤美化、脸部重塑与妆容调整、全身能够满足专业摄影师和修图师对高品质图片的需求https://www.chging.com/ 化为