D-ID

D-ID是领先的AI数字人视频生成平台,仅需一张照片即可生成会说话的逼真数字人,支持多语言配音与口型同步,广泛应用于营销、培训与客服场景。

访问官网
D-ID

特点

AI 数字人视频创作

只需一段文本或音频,即可生成逼真的数字人视频,唇形、表情与语音自动同步,无需拍摄即可快速产出专业级内容。

多模态语音驱动

支持数十种语言与口音,结合情感语调与节奏控制,使数字人的表达更贴近真人,轻松应对跨国沟通和本地化场景。

灵活集成与部署

提供标准化 API 和 SDK,可快速嵌入网站、App 或实时交互系统,实现数字人能力高效落地,适配多行业定制需求。

基本信息

D-ID
  • 出品方:D-ID Ltd.(以色列人工智能公司)
  • 英文名称:D-ID(Digital Identity)
  • 首次发布:2019 年(面部去像素化技术),2022 年推出 Creative Reality Studio 平台
  • 产品类型:AI 数字人生成与视频制作平台,支持文本转视频、人脸动画、实时数字人对话
  • 核心能力:面部动画与口型同步、视频翻译与配音、老照片修复与动态化、实时交互式数字人、API 集成
  • 最新模型:D-ID 5.0(2024 年发布,增强实时生成与高保真度)
  • 视频规格:支持高清渲染(最高 1920×1080),单段最长约 5 分钟,支持多种宽高比

所获荣誉

D-ID
  • 福布斯AI 50:2023年,D‑ID凭借其创新的生成式人工智能视频技术,入选《福布斯》最具潜力人工智能企业榜单,成为全球AI视频领域的代表之一。
  • SXSW创新奖:2023年,D‑ID在西南偏南(SXSW)大会上获得“人工智能与机器学习”类别创新奖,表彰其在深度学习和数字人交互方面的突破。
  • 红点设计大奖:2022年,D‑ID的数字人平台因其卓越的用户界面设计和交互体验,荣获红点品牌与传播设计奖。
  • Gartner Cool Vendor:2022年,D‑ID被Gartner评为“人工智能领域酷供应商”,以肯定其在视频合成与实时面部动画方面的独特技术优势。
  • Webby Awards提名:2023年,D‑ID的技术应用在“新媒体与艺术”类别中获得威比奖提名,展现了AI生成内容在创意产业中的影响力。

发展历史

2017

D-ID 在以色列特拉维夫成立,创始团队包括 Gil Perry、Eliran Kuta 和 Sella Blondheim。公司最初专注于人脸去识别技术,利用深度学习算法对视频中的人脸进行模糊或替换,以保护个人隐私。

2018

完成种子轮融资,由人工智能领域的知名风投机构领投。同年推出第一代人脸去识别 API,主要面向安防监控、媒体制作和医疗影像等需要隐私保护的行业客户。

2019

技术路线发生重要转折。团队发现其去识别算法中的人脸生成模块具有创造虚拟人物的潜力,开始投入资源研发基于生成对抗网络(GAN)的肖像视频合成技术。同年提交多项核心专利。

2020

正式从隐私保护赛道转向生成式 AI 视频领域。推出初始版本的“面部再演”(Face Reenactment)技术,能够基于单张照片驱动面部表情和头部运动。该技术被多家媒体公司用于虚拟主播实验。

2021

发布 D-ID 创意实感工作室(Creative Reality™ Studio)测试版。用户上传一张静态照片并输入文本,即可生成逼真的说话视频。该产品在微软等企业合作伙伴的内测中获得积极反馈。

2022

Creative Reality™ Studio 正式向公众开放,支持英语、西班牙语、法语等语言。同年推出 AI 虚拟人定制功能,允许企业创建专属数字员工用于客户服务、培训和营销。用户量突破百万。

2023

与 ElevenLabs 达成合作,集成其高保真语音合成模型,大幅提升虚拟人的声音真实度。发布 D-ID 无代码视频编辑平台,用户无需编程即可通过拖拽方式制作 AI 数字人内容。同年完成 2500 万美元 B 轮融资。

2024

推出 D-ID 虚拟智能体(D-ID Agents),具备实时对话、手势生成和上下文记忆能力。该产品可用于教育、零售和客服场景,实现人与 AI 数字人的自然交互。公司开始探索多模态情感识别技术。

2025

发布移动端 SDK,允许第三方应用内嵌数字人功能。更新视频生成模型至第四代,支持实时面部表情捕捉与多摄像头视角切换。公司宣称月活跃视频生成量突破 5 亿次。