豆包上线视频通话功能:支持实时问答互动,具备视觉理解能力

分类:资讯 日期:

近日,豆包在 App 端上线实时视频通话功能,用户在“打电话”界面点击视频按钮即可开启视频通话,支持基于真实场景与用户进行实时问答互动。

譬如,用户可在旅行过程中通过该工具询问自身所处景点的历史背景、特色内容或路线规划等,其背后由豆包最新的视觉理解模型支持,可融合视觉与语言输入进行综合的深度思考、创作。

豆包视频通话功能还接入了联网搜索能力,实时获取互联网最新信息,以进一步提升对话的准确性与时效性。根据图像信息,豆包视觉理解模型还能完成多种复杂逻辑计算任务,包括解微积分题、分析论文图表、诊断真实代码问题等“挑战性”任务。