使用方法

注册与登录

打开 D-ID 官方网站,点击右上角的“Get Started”或“Sign Up”按钮。你可以使用 Google 账号、Microsoft 账号或直接填写邮箱进行注册。完成验证后进入主控制台,界面会默认显示“Create Video”模块。首次登录建议先查看左侧菜单栏中的“Tutorials”快速了解基本操作,但实际使用中直接点击“Create Video”即可开始。

选择或创建数字人形象

在创作页面,你会看到“Presenter”区域。D-ID 提供多种预设数字人形象,包括写实风格和卡通风格。点击“Choose Presenter”可以浏览官方模板库,选中后形象会立即加载到预览窗口。如果你希望使用自己的形象,点击“Upload Photo”或“Upload Video”上传一张正面人脸照片或一段人物说话的视频。上传后系统会在几秒内完成面部建模,自动生成一个可驱动的数字人。注意照片要求:面部清晰、光照均匀、无遮挡,分辨率建议不低于 1024×1024 像素。上传视频时,尽量选择人物说话自然、背景简洁的片段,时长不超过 30 秒效果最佳。

输入脚本与语音设置

在“Script”文本框中输入你想要数字人说的台词。你可以直接打字,也可以粘贴现有文案。D-ID 支持多国语言输入,包括中文、英文、日文、韩文、西班牙文等,系统会自动识别语言并匹配语音合成引擎。点击“Voice”下拉菜单,选择合适的语音。官方提供数十种不同性别、年龄和语调的 AI 语音,例如“Chinese Female (Standard)”或“Chinese Male (Natural)”。如果你希望更接近真人效果,可以勾选“Expressivity”选项,让数字人在说话时带有自然的情绪起伏和微表情。另外,还可以通过“Pause”按钮在脚本中插入停顿标记,用逗号或句号控制语速节奏。

调整视频参数

在右侧“Settings”面板中,你可以修改视频的宽高比,支持 16:9、9:16、1:1 等常见尺寸,适配 YouTube、TikTok、Instagram 等不同平台。背景可以选择纯色、渐变或上传自定义图片。如果使用上传的照片作为数字人形象,建议选择与面部色调协调的背景。此外,“Background Audio”选项允许你添加背景音乐或环境音效,D-ID 内置了少量免费音轨,也支持上传自己的音频文件。注意背景音乐的音量不宜过大,否则会盖过数字人的语音。完成所有设置后,点击预览窗口下方的“Generate Preview”按钮,系统会生成一段低分辨率的预览视频,时长通常为原始脚本长度,最长支持 5 分钟。

生成与导出视频

预览效果满意后,点击“Generate Video”按钮。D-ID 会在云端渲染,根据视频长度和分辨率不同,等待时间从几十秒到几分钟不等。渲染完成后,视频会自动出现在“My Videos”页面。你可以点击视频右下角的播放按钮再次查看,也可以直接点击“Download”按钮将视频保存为 MP4 格式。免费用户下载的视频带有 D-ID 水印,且分辨率为 720p。付费订阅用户可选择 1080p 甚至 4K 分辨率,并移除水印。如果需要二次编辑,D-ID 支持在生成后修改脚本、语音或形象,但每次修改都需要重新渲染。另外,团队协作功能允许你将项目分享给同事,共同编辑同一段视频。

进阶技巧与注意事项

为了获得更自然的数字人表现,脚本中尽量避免过长的句子,建议每句话不超过 20 个汉字。在中文语音合成时,适当添加语气词(如“嗯”“啊”)能提升真实感。如果你上传的是照片,注意数字人的口型匹配只对清晰可见的嘴唇有效,侧面照或嘴巴被遮挡的照片会导致口型错误。对于企业用户,D-ID 提供 API 接口,可以通过代码批量生成视频,官方文档中附有 Python 和 Node.js 的示例。此外,每天第一次生成视频时,建议先清空浏览器缓存,以免加载旧素材。免费账户每月有 5 分钟的视频生成额度,超出后需要升级套餐。所有生成的视频默认存储 30 天,请及时下载到本地。