谷歌的Lookout应用程序可以帮助盲人或弱视人士识别物体并阅读文档,现在正在使用人工智能生成更详细的图像描述。
作为更新的一部分,即使没有任何标题或替代文本,用户也可以上传图像并获得有关所描绘内容的更准确信息。(替代文本描述了图像,并且可以通过屏幕阅读器为视障人士大声朗读。)此外,人们可以通过输入问题或使用语音来询问有关图像的后续问题。这可以帮助提供更多详细信息并更好地了解所显示的内容。
Lookout 应用程序中一只狗在海滩上奔跑的屏幕截图,并附有后续问题
通过 Lookout 的更新,用户可以询问有关图像的后续问题以获取更多详细信息。
谷歌
谷歌表示,Lookout 上的新图像问答功能可用于没有替代文本的社交媒体照片、群聊中的图片或某人相机胶卷中的图像。
Lookout 产品经理斯科特·亚当斯 (Scott Adams) 告诉 CNET:天辰注册网址“视觉媒体如此之多,无处不在,但往往难以访问。” “我们正在努力使其更具包容性,并真正为人们提供另一种工具,另一种与视觉世界互动的选择。”
图像问答功能周二在美国、英国和加拿大仅以英语推出,最终以更多语言在全球推出。
Adams 表示:“我们确实希望确保将其提供给足够多的人,并且在进一步推出之前,我们可以对人们如何使用它、他们正在经历什么、我们应该改进什么建立一些真正的信心。”说。“如果我们在全球范围内推出,我们还希望确保不同文化和穿着不同服装的人们对模特处理从他们的环境中拍摄的照片的方式感到满意。”
Lookout 还添加了 11 种新语言,包括中文、日语和韩语。现在它总共支持 34 种语言。
Lookout 是 Google 旨在提高数字可访问性的多个应用程序和功能之一。天辰注册网址近年来,这家搜索巨头还推出了 Project Relate,旨在帮助有语言障碍的人更轻松地与他人交流; Live Transcribe,为耳聋或听力有困难的人提供实时语音到文本转录;声音通知,提醒听力损失者有关“重要的家庭声音”,例如电器的蜂鸣声、流水声和狗叫声。 去年,它还为 Pixel 手机推出了一项新的辅助功能,以帮助盲人和低视力用户进行自拍。
其他科技公司也发布了相应的辅助功能更新。Apple 的 人物检测功能 可以让盲人和弱视 iPhone 和 iPad 用户知道某人与他们的距离有多近,并且该公司 在 iPhone、iPad 和 Mac 上添加了实时字幕,以帮助人们跟随 FaceTime、视频会议应用程序上的音频和视频和流媒体。与此同时,科技巨头亚马逊最近添加了一项功能,让 患有听力损失的Amazon Fire TV 客户 可以将音频直接传输到他们的听力植入物。它还发布了一项名为 “Dialogue Boost”的功能,这使得观众可以更轻松地听到节目或电影中背景音乐和效果之上的对话。