生成式人工智能 | 小吴Runne的博客（驻村中）

type

status

date

slug

summary

通用大模型

DeepSeek提供网页版、移动端App和API接口，支持联网搜索和深度思考，能高效处理复杂问题和推理任务，是科研、商业和日常生活中的智能助手。

深度求索（DeepSeek），成立于2023年，专注于研究世界领先的通用人工智能底层模型与技术，挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源，深度求索团队仅用半年时间便已发布并开源多个百亿级参数大模型，如DeepSeek-LLM通用大语言模型、DeepSeek-Coder代码大模型，并在2024年1月率先开源国内首个MoE大模型（DeepSeek-MoE），各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。和 DeepSeek AI 对话，轻松接入 API。

https://www.deepseek.com/

Kimi支持中英文对话，并支持多种文件格式，具备搜索能力，提供网页版和App使用，最高支持200万tokens的上下文窗口，即能够处理长达200万汉字的文本。

Kimi - 会推理解析，能深度思考的AI助手

Kimi 是一个有着超大“内存”的智能助手，可以一口气读完二十万字的小说，还会上网冲浪，快来跟他聊聊吧 | Kimi - Moonshot AI 出品的智能助手

https://kimi.moonshot.cn/

文心一言可以进行自然语言交互、信息检索和任务执行，支持文本、语音等多种交互方式，提供网页版和App使用。

文心一言

文心一言既是你的智能伙伴，可以陪你聊天、回答问题、画图识图；也是你的AI助手，可以提供灵感、撰写文案、阅读文档、智能翻译，帮你高效完成工作和学习任务。

https://yiyan.baidu.com/

讯飞星火拥有跨领域知识和语言理解能力，支持多语种语音识别与合成，提供网页版和App使用。

讯飞星火-懂我的AI助手

讯飞星火大模型，是由科大讯飞推出的新一代认知智能大模型，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务，提供语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等多种能力。

https://xinghuo.xfyun.cn/desk

智谱清言能够进行文件处理、数据分析、图表绘制等复杂任务，并支持多种文件格式，提供网页版和App使用。

智谱清言

中国版对话语言模型，与GLM大模型进行对话。

https://chatglm.cn/

通义千问以对话形式解答问题，提供信息查询及知识分享，适用教育、咨询、企业服务等多种场景，提供网页版和App使用。

tongyi.aliyun.com

https://tongyi.aliyun.com/

百川智能推出了包括Baichuan-7B和Baichuan-13B在内的多款AI产品，支持自然语言处理、知识问答和文本生成等功能。

百小应-懂搜索的AI助手

懂搜索的AI助手，读论文，读财报，轻松无忧！写代码，写文案，样样精通！能识图，可语音，简洁易用！

https://chat.baichuan-ai.com/

豆包一款多功能人工智能助手，基于云雀大模型，提供聊天机器人、写作助手、英语学习助手、AI图片生成和数据可视化等主要功能，广泛应用于教育、内容创作和音乐生成等场景，提供网页版、APP版和插件使用。

豆包

豆包是你的 AI 聊天智能对话问答助手，写作文案翻译编程全能工具。豆包为你答疑解惑，提供灵感，辅助创作，也可以和你畅聊任何你感兴趣的话题。

https://www.doubao.com/chat/

ChatGPT支持多种语言和多种插件，能够帮助解答问题、提供信息、撰写文本、解析数据等，相比3.5版本，最高支持12.8万tokens的上下文窗口。

ChatGPT

A conversational AI system that listens, learns, and challenges

https://chat.openai.com/

Google Gemini分为Ultra、Pro和Nano三种版本，适用于从大型数据中心到移动设备的各种场景，最高支持100万tokens的上下文窗口。

‎Google Gemini

Meet Gemini, Google’s AI assistant. Get help with writing, planning, brainstorming, and more. Experience the power of generative AI.

https://gemini.google.com/

Claude.ai包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus三个版本，最高支持20万tokens的上下文窗口，更适用于专业领域或复杂推理。

Claude

Talk with Claude, an AI assistant from Anthropic

https://claude.ai/

翻译辅助

Deepl与先进的人工智能技术结合，可实现PDF、Word 和 PowerPoint 一键翻译整篇文档，所有的翻译文档可实现原格式保存。新用户可享受2次免费全文上传翻译，段落翻译不受使用次数限制。需使用Edge、google Chrome浏览器安装插件。

DeepL翻译：全世界最准确的翻译

即时翻译文本&完整的文档文件。为个人和团队提供准确的翻译。每天有数百万人使用DeepL进行翻译。

https://www.deepl.com/zh/translator

Immersive Translate双语对照网页翻译插件，可免费进行外语网页、Word文档、PDF、EPUD电子书、视频双语字幕翻译等。需使用Edge、google Chrome浏览器安装插件。

Bilingual Web Translation Extension_PDF Document Translation Tool | Immersive Translate

Immersive Translate is a free-to-use website translation extension that provides you with online bilingual web page translation. It can be used to translate websites to English or other languages, documents in various formats including PDF and EPUB eBooks, bilingual subtitles for videos (support for YouTube, Netflix, and other mainstream video sites), TXT and other file translation services. Compatible with Chrome, Edge, Firefox, Safari, and other mainstream browsers, as well as being able to be installed on cell phones and computers. Supported languages include English, Spanish, Chinese, French, German, Russian, Japanese, Korean, Portuguese, Vietnamese, Indonesian, Italian, Dutch, Thai, and dozens of other languages. Supports multiple translator APIs: DeepL Translator, Google Translator, Open AI (ChatGPT), Gemini, Artificial Intelligence Translation, Youdao Translator, LingoCloud Translator, Baidu Translator, Volcengine Translator, Niutrans Translator, and others. It is the webpage translation extension tool that understands your needs and provides you with the most seamless website translation experiences available.

https://immersivetranslate.com/en/

Sider一款功能强大的AI浏览器插件，集成了o1-preview & o1-mini， GPT-4o等多个AI模型，可在任何网页上辅助阅读和写作。Sider跨平台支持 Chrome、Edge、Safari、iOS、Android、Windows 和 MacOS，界面简洁直观。

Sider: ChatGPT Sidebar + GPT-4.1, Claude 3.5, Gemini 2.5 & AI Tools

Sider, the most advanced AI assistant, helps you to chat, write, read, translate, explain, test to image with AI, including GPT-4.1 & GPT-4.1 mini, Gemini and Claude, on any webpage.

https://sider.ai/

编程辅助

通义灵码是阿里云推出的智能编码辅助工具，基于通义大模型训练。它能够自动生成行级或函数级代码、单元测试和代码注释，并提供代码解释和智能问答功能。支持多种编程语言和主流集成开发环境（IDE）。

通义灵码_你的智能编码助手-阿里云

通义灵码是由阿里云提供的智能编码辅助工具，提供代码智能生成、智能问答、多文件修改、编程智能体等能力，为开发者带来智能化研发体验，引领 AI 原生研发新范式。

https://tongyi.aliyun.com/lingma

Cursor是由Anysphere公司推出的AI代码编辑器，支持多种编程语言。基于GPT-3.5和GPT-4模型，它能够自动生成、优化和重构代码。Cursor集成了版本控制和自动化测试等功能，提升开发效率和代码质量。它兼容Mac、Windows和Linux操作系统。

Cursor - The AI Code Editor

Built to make you extraordinarily productive, Cursor is the best way to code with AI.

https://www.cursor.com/

GitHub Copilot是由GitHub和OpenAI合作开发的AI编程助手，基于OpenAI Codex模型。它支持多种编程语言，并能在主流开发环境中自动生成和补全代码。Copilot还提供错误检测、代码优化和文档生成功能，显著提升编程效率和代码质量。

GitHub Copilot · Your AI pair programmer

GitHub Copilot works alongside you directly in your editor, suggesting whole lines or entire functions for you.

https://github.com/features/copilot

多模态应用

Midjourney可以创建多样化的图像，对设备硬件无要求，运行需全程联网，数据存在服务器上。

www.midjourney.com

Midjourney is an independent research lab exploring new mediums of thought and expanding the imaginative powers of the human species.

https://www.midjourney.com/home

Dall-E 3基于ChatGPT构建的图像生成模型，能够理解自然语言并生成高分辨率图像，支持多种图像尺寸和风格。

DALL·E 3

DALL·E 3 understands significantly more nuance and detail than our previous systems, allowing you to easily translate your ideas into exceptionally accurate images.

https://openai.com/dall-e-3

Stable Diffusion一个开源的图像生成模型，支持本地离线使用，对硬件要求较高，但允许用户在生成图像后进行图像元素调整，并以稳定和高质量图像输出而闻名，入门门槛较高。

Stable Diffusion 在线

Stable Diffusion 是一个深度学习模型，可以从文本描述生成图像。免费在线使用 Stable Diffusion。

https://stablediffusionweb.com/zh-cn

Leonardo采用SD的方案，在线版生图质量高，有实时绘画、图片放大、图片视频生成等功能。

AI Image Generator - Create Art, Images & Video | Leonardo AI

Transform your projects with our AI image generator. Generate high-quality, AI generated images with unparalleled speed and style to elevate your creative vision

https://leonadoai.com/

AI Image Generator - Create Art, Images & Video | Leonardo AI

Runway支持文本到视频（T2V）和图像到视频（I2V）的创作，用户可以通过输入文本或上传图像生成视频。Runway还提供视频抠像、慢动作效果等多种AI工具，且无需下载，直接在浏览器中使用。

Runway

Everything you need to make anything you want.

https://app.runwayml.com/

一帧视频其功能包括秒创数字人、秒创AI帮写、秒创图文转视频、秒创AI视频、秒创AI语音、秒创AI作画等，提供网页版和App使用。

【官网】秒创（一帧秒创）-AI视频创作,数字人,秒创视频生成,智能内容创作平台

一帧秒创是基于新壹大模型及秒创AIGC引擎的智能AI内容生成平台，包含AI数字人、AI帮写、AI视频、AI作画等AIGC工具，可将百家号、公众号、头条号、搜狐号、新浪微博、小红书等文章一键转视频，一键生成数字人播报视频，为企业及自媒体提供一站式视频生产，全面提升内容创作效率。

https://aigc.yizhentv.com/

即梦AI支持AI配音、自动生成字幕、以及数字人物生成等，适用于iOS、Android、Windows和Mac OS多种操作系统。

即梦AI - 一站式AI创作平台

https://jimeng.jianying.com/ai-tool/home

可灵AI采用3D时空联合注意力机制和自研3D VAE网络，支持文本和图像生成高质量视频。其应用涵盖广告制作、社交媒体内容创作、在线教育、娱乐产业等。

Kling AI: Next-Gen AI Video & AI Image Generator

Create professional videos and images with Kling AI's state-of-the-art generative AI platform. Our tools support video generation, image creation, and advanced editing capabilities for content creators.

https://klingai.kuaishou.com/

Pika用户可通过文本或图像输入来生成多种风格（如3D动画、动漫）的视频，还可对视频或图像进行编辑。

Pika

The idea-to-video platform that sets your creativity in motion.

https://pika.art/

剪映由字节跳动旗下的脸萌科技开发的一款视频编辑工具，适合需要丰富音乐素材和简便操作的用户，尤其是抖音等短视频平台的创作者。

剪映官网-全能易用的桌面端剪辑软件-轻而易剪上演大幕

剪映专业版是一款全能易用的桌面端剪辑软件，让创作更简单。剪映官网为您提供剪映专业版免费下载服务，专业版包括Windows端与Mac端，快来体验吧！

https://www.capcut.cn/

Stable Audio用户可以通过输入文本提示生成多种类型的背景音乐，音频长度可达3分钟。免费版每月可生成20个音乐，不能用于商业用途；每月收费11.99美元，可生成500个音乐，允许商业用途。

www.stableaudio.com

https://www.stableaudio.com/

腾讯智影一款云端智能视频创作工具，提供数字人播报、AI文本配音、自动字幕识别、智能去水印和文章转视频等特色功能，帮助用户高效便捷地制作高质量视频内容。

腾讯视频智能制作平台-在线智能视频创作平台

腾讯视频智能制作平台是一款云端智能视频创作工具，集素材搜集、视频剪辑、渲染导出和发布于一体的免费在线剪辑平台。强大的AI智能工具，支持文本配音、数字人播报、自动字幕识别、文章转视频、去水印、视频解说、横转竖等功能，拥有丰富的素材库，极大提升创作效率，帮助用户更好地进行视频化的表达。

https://zenvideo.qq.com/

万彩AI一款数字人制作工具，提供多样化角色、智能面部识别、语音合成与配音、个性化定制和一键生成动画等功能。

万彩AI - AI智能写作生成神器,AI数字人制作,AI短视频制作

万彩AI是一款强大的AI内容创作工具合集，除了提供AI智能写作支持之外，还集成了AI换脸、AI数字人制作和AI短视频制作等强大的AI生成内容功能，进一步扩展了AI的创作领域，使您的创作具有无限可能

https://ai.kezhan365.com/?animiz

HeyGen一个基于人工智能的视频生成平台，支持文本转语音、多语言翻译配音、AI数字人和语音克隆等功能。平台提供免费版本和多种付费方案，创作者版本每月29美元起，商业版本每月89美元起，分别提供不同的积分和功能支持。

HeyGen - AI Spokesperson Video Creator

Create customized videos using HeyGen's AI Video Generator, turning scripts into talking videos with customizable AI avatars in minutes, without a camera or crew.

https://app.heygen.com/home

通用大模型

翻译辅助

编程辅助

多模态应用

runnewu