作者 | 江宇
编辑 | 漠影
智东西AI前瞻5月30日报道,豆包APP近日推出实时视频通话作用。使用者在电话画面开启视频画面后,即可与豆包基于真实场景进行实时问答互动 。
该作用将豆包的视觉理解能力,从图片场景扩展到视频场景。去年底,豆包就曾上线图片理解作用,适配上传图片后识别素材,包括理解梗图等 。
此次升级以期进一步降低使用者交互门槛,供应“边看边聊”的体验。
使用者在旅行过程中,可打开视频通话,询问所处景点的历史背景、特色素材或路线规划等。例如,在故宫参观时,使用者具备通过视频向“豆包”展示景点画面,了解特定宫殿的历史故事、建筑特色 。
在博物馆、美术馆等场景,也具备通过视频通话作用,随时问豆包展品的背景信息 。
0号新闻网 NgAAAAAgAB4iG8MwAAAABJRU5ErkJggg==” style5=” width: 640px; height: 640px;” alt=”豆包再进化!具备帮朋友们在线选榴莲了” />
此实时视频通话作用的实现,是基于豆包最新的视觉理解模型。该模型具备素材识别、理解推理和素材描述能力,能够融合视觉与语言输入,进行综合的深度思考和创作。
此外,为提升对话的准确性与时效性,豆包视频通话作用接入了联网搜索能力,以获取互联网最新信息。
智东西也在深度体验了豆包视频通话的作用:打开豆包App后,点击“对话”、“通话图案”、“开启视频通话”。
值得一提的是,豆包电脑端也已同步开启共享视频通话作用,多平台覆盖,为使用者供应更灵活的选取。
想知道豆包App的视频通话作用有多强大?智东西替朋友们先试为快。
此前的ChatGPT就在网络上掀起一阵挑选“报恩”榴莲的热潮。那么,比起稳定的图片分析,在视频通话中,豆包能否通过视频帮朋友们挑选出最完美的榴莲?
在实际体验中,豆包确实能够通过视频画面给出详细的榴莲挑选建议,例如根据果壳上刺的特征进行判断,推测果肉的成熟度。这为像挑选榴莲这类需要眼力和经验的场景,供应了出人意料的AI辅助。
AI和人类交互的手段愈发多样,也变得越来越有趣。更多关于豆包的新作用,使用者具备自行探索。