D-ID 是一家专注于生成式人工智能视频与数字人技术的科技公司,总部位于以色列特拉维夫。公司名称取自“De-Identification”(去身份化),最初以保护人脸隐私的算法起家,随后转向利用深度学习生成逼真的动态虚拟人物。自 2017 年成立以来,D-ID 持续投入计算机视觉、图形学与自然语言处理领域的研发,逐步构建起一套完整的“创意现实”AI 视频生成平台。
D-ID 的核心技术建立在生成对抗网络与神经辐射场基础之上,能够从单张静态照片或一段短音频中实时生成具有自然头部运动、眨眼、口型同步的高质量视频。公司自主研发的“表情传递”算法可以捕捉原始音频中的情绪波动,并将其映射到数字人面部,使虚拟角色表现出与语音一致的喜怒哀乐。此外,D-ID 在实时推理优化方面取得突破,能够在普通消费级 GPU 上完成 1080p 甚至 4K 分辨率的视频渲染,延迟控制在毫秒级别。
D-ID 旗下主要产品为 Creative Reality™ Studio,这是一个基于浏览器的创作平台,用户无需任何编程或动画经验即可快速生成数字人视频。该平台支持上传人物肖像、输入或上传文本/音频,选择多语言语音(包括中文、英语、日语、西班牙语等三十余种),并自动生成一段口型精准、表情生动的 AI 视频。针对企业级客户,D-ID 提供可定制的 API 接口,允许将数字人视频功能嵌入到在线教育、客户服务、虚拟主播、数字营销等现有系统中。公司还推出了实时数字人直播解决方案,通过低延迟流媒体协议,让虚拟角色在直播平台中与观众实时互动。
D-ID 的使命是让人类与人工智能之间的交流回归自然。公司认为,未来的数字交互不应局限于文本或静态图像,而应具备与真人无异的表情、语气和肢体语言。通过降低视频生成门槛,D-ID 希望帮助教育机构、内容创作者、企业品牌乃至个人用户,用最直观的“面孔”进行沟通,消除语言与文化壁垒。公司强调技术伦理,在数字人应用中加入可追溯的版权标识与内容审核机制,防止生成误导性或伪造信息。
D-ID 的创始团队由计算机视觉研究员、图形学工程师和连续创业者组成,核心成员曾参与以色列国防军精英情报部门的技术研发。公司目前拥有超过两百名员工,分布在特拉维夫总部以及北美、欧洲的远程办公室。团队文化强调跨学科协作,工程师与产品经理、用户研究员共同迭代功能,每周举行内部演示会分享最新算法进展。D-ID 鼓励开放的研究氛围,多次在 CVPR、SIGGRAPH 等顶级学术会议上发表关于人脸生成与运动合成的前沿论文。
截至 2025 年,D-ID 已获得包括红杉资本、英特尔资本在内的多轮融资,累计筹集资金超过 1.5 亿美元。其平台注册用户超过 400 万,企业客户涵盖沃尔玛、欧莱雅、BBC 等大型机构。在 Gartner 2024 年 AI 视频生成魔力象限中,D-ID 被列为领导者象限。公司注重隐私合规,通过 ISO 27001 信息安全管理认证,并对所有生成内容添加隐写水印以防止滥用。目前,D-ID 正在探索将数字人技术拓展至 AR/VR 设备,实现沉浸式空间中的实时虚拟化身交互。