使用方法 - D-ID官网中文站

注册与登录

打开 D-ID 官方网站，点击右上角的“Get Started”或“Sign Up”按钮。你可以使用 Google 账号、Microsoft 账号或直接填写邮箱进行注册。完成验证后进入主控制台，界面会默认显示“Create Video”模块。首次登录建议先查看左侧菜单栏中的“Tutorials”快速了解基本操作，但实际使用中直接点击“Create Video”即可开始。

选择或创建数字人形象

在创作页面，你会看到“Presenter”区域。D-ID 提供多种预设数字人形象，包括写实风格和卡通风格。点击“Choose Presenter”可以浏览官方模板库，选中后形象会立即加载到预览窗口。如果你希望使用自己的形象，点击“Upload Photo”或“Upload Video”上传一张正面人脸照片或一段人物说话的视频。上传后系统会在几秒内完成面部建模，自动生成一个可驱动的数字人。注意照片要求：面部清晰、光照均匀、无遮挡，分辨率建议不低于 1024×1024 像素。上传视频时，尽量选择人物说话自然、背景简洁的片段，时长不超过 30 秒效果最佳。

输入脚本与语音设置

在“Script”文本框中输入你想要数字人说的台词。你可以直接打字，也可以粘贴现有文案。D-ID 支持多国语言输入，包括中文、英文、日文、韩文、西班牙文等，系统会自动识别语言并匹配语音合成引擎。点击“Voice”下拉菜单，选择合适的语音。官方提供数十种不同性别、年龄和语调的 AI 语音，例如“Chinese Female (Standard)”或“Chinese Male (Natural)”。如果你希望更接近真人效果，可以勾选“Expressivity”选项，让数字人在说话时带有自然的情绪起伏和微表情。另外，还可以通过“Pause”按钮在脚本中插入停顿标记，用逗号或句号控制语速节奏。

调整视频参数

在右侧“Settings”面板中，你可以修改视频的宽高比，支持 16:9、9:16、1:1 等常见尺寸，适配 YouTube、TikTok、Instagram 等不同平台。背景可以选择纯色、渐变或上传自定义图片。如果使用上传的照片作为数字人形象，建议选择与面部色调协调的背景。此外，“Background Audio”选项允许你添加背景音乐或环境音效，D-ID 内置了少量免费音轨，也支持上传自己的音频文件。注意背景音乐的音量不宜过大，否则会盖过数字人的语音。完成所有设置后，点击预览窗口下方的“Generate Preview”按钮，系统会生成一段低分辨率的预览视频，时长通常为原始脚本长度，最长支持 5 分钟。

生成与导出视频

预览效果满意后，点击“Generate Video”按钮。D-ID 会在云端渲染，根据视频长度和分辨率不同，等待时间从几十秒到几分钟不等。渲染完成后，视频会自动出现在“My Videos”页面。你可以点击视频右下角的播放按钮再次查看，也可以直接点击“Download”按钮将视频保存为 MP4 格式。免费用户下载的视频带有 D-ID 水印，且分辨率为 720p。付费订阅用户可选择 1080p 甚至 4K 分辨率，并移除水印。如果需要二次编辑，D-ID 支持在生成后修改脚本、语音或形象，但每次修改都需要重新渲染。另外，团队协作功能允许你将项目分享给同事，共同编辑同一段视频。

进阶技巧与注意事项

为了获得更自然的数字人表现，脚本中尽量避免过长的句子，建议每句话不超过 20 个汉字。在中文语音合成时，适当添加语气词（如“嗯”“啊”）能提升真实感。如果你上传的是照片，注意数字人的口型匹配只对清晰可见的嘴唇有效，侧面照或嘴巴被遮挡的照片会导致口型错误。对于企业用户，D-ID 提供 API 接口，可以通过代码批量生成视频，官方文档中附有 Python 和 Node.js 的示例。此外，每天第一次生成视频时，建议先清空浏览器缓存，以免加载旧素材。免费账户每月有 5 分钟的视频生成额度，超出后需要升级套餐。所有生成的视频默认存储 30 天，请及时下载到本地。