3月22日消息,美国当地时间周二,微软宣布在必应搜索和浏览器Edge中增加AI图像生成功能,只需依据文字描述就能生成相应图片。
这一新功能名为Image Creator,由OpenAI的生成式图像生成器DALL-E提供支持。不过,微软没有透露其采用的是哪个版本的DALL-E,只是称其为“最新版DALL-E模型”。
Image Creator现在正在必应预览版中向用户推出,并且只能通过必应的“创意模式”(Creative Mode)使用。将来,该功能也将扩展到必应“平衡模式”(Balanced Mode)和“精确模式”(Precise Mode)中。
同时,新的图像生成器也将出现在Edge侧边栏中,允许用户利用文本输入提示创建图像。微软表示,随着时间的推移,Image Creator将增加更多的语言支持。
按照文字提示,Image Creator将生成由四张高分辨率DALL-E图像组成的正方形。微软副总裁尤瑟夫·迈赫迪(Yusuf Mehdi)表示: “我们还明确表示,Image Creator的图像是由AI生成的,并在每张图像的左下角都包含了经过修饰的必应图标,以帮助证明该图像是使用Image Creator创建的。”
微软迅速将AI文本转图像功能引入必应,这可能会导致该搜索引擎产生糟糕的图像。专家警告说,文本转图像系统生成的图像可能被用于宣传、骚扰、虚假信息等。
对此,微软解释说:“为了防止滥用,我们已经引入了OpenAI的保护措施,并为Image Creator增加了额外的防护。例如,我们已经实施了旨在限制有害或不安全图像生成的控制措施。当我们的系统检测到提示可能导致生成潜在有害图像时,它会阻止提示并警告用户。”
微软表示,该公司将继续对图像生成器进行迭代更新。具体来说,微软强调其正在努力优化Image Creator在多轮聊天中的工作方式。该公司发文称:“我们仍然相信,将这些技术推向市场的最好方法是在公开场合仔细测试它们,这样每个人都可以提供反馈。”
除了新的图像生成器,必应还获得了两个额外的新搜索功能:视觉故事(Visual Stories)和知识卡2.0。在必应之前的版本中,这些知识卡类似于谷歌的知识面板,但现在它们增加了新的元素,包括AI生成的信息图表和更具互动性的内容,如图表和时间线等。
与此同时,视觉故事功能更像是AI生成版的Instagram stories。据悉,微软最近几周始终在测试这些功能,因为它们在部分用户搜索中出现的频率很高。这些故事配有AI生成的音频旁白,具体取决于主题。有时,它们会出现在搜索结果的首位,也可能出现在知识卡中。
例如,当搜索“俄勒冈州波特兰”时,必应会突出显示诸如“如何在波特兰市内找到真菌”和“波特兰:美国最古怪城市”之类的故事。然而令人稍感遗憾的是,目前似乎还没有一种方法可以直接链接到这些故事。(小小)