IT之家11月6日报道,今天举行的科大讯飞1024 2025开发者节上,科大讯飞宣布推出全新多模态数字人。科大讯飞表示,其具有先进多模态交互能力的数字真人导游“小飞”已正式亮相并投入运营。 “小飞”打破了简单问答的界限,实现了多人之间的自由对话和多语言交流。它还具有自定义记忆功能,可以让您记住访客的历史信息并提供详细的提醒。此外,您还可以瞬间变身为“林黛玉”等各种头像,提供更全面的服务。科大讯飞总裁刘庆峰表示,通过集成远场识别、3D视觉感知、情感意义理解等八项核心功能,“小飞”已经证明人工智能不再是一个简单的应用,而是一个“类人”的伙伴,可以进入真实的物理空间并提供德情感和细致的服务。 IT之家在发布会上获悉,科大讯飞还宣布了业界首个基于 Spark 音频大模型的“可变音频播放”技术。用户可以录制单个短语,以高保真度重新创建任何声音,并使用单个命令创建任何风格。这项技术进步预计将给数字角色、有声读物和内容创作等领域带来变化,让每个人都能创造自己的声音。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。