Google推出新AI SDK,简化在安卓应用中集成高性能模型Gemini Pro


谷歌正在进行“Ask Photos”功能的测试,该功能使用户能通过自然语言与个人照片库互动,如提问查看去过每个国家公园的最佳照片或查询车牌号。这一功能还未正式发布,但已包含在谷歌应用的最新版本中。通过“Ask Photos”,照片和视频将转变为一个能智能提取信息和上下文的视觉数据库。报告指出,代码中包含的关键词暗示了与谷歌Gemini相关的新扩展功能。此功能可能与即将在Google Photos应用中推出的“Ask Photos”特性相似,与常规搜索结果结合,并可能利用Google Lens增强输出内容,如识别图片中的物品价格或收集名胜古迹信息。如果“Ask Photos”与Google Lens结合,将为用户提供一个强大的工具,利用最新的网络上下文轻松搜索Google Photos库。
["Google Bard 今天宣布进行全球更新,将 Gemini Pro 大语言模型功能扩展到 40 种语言,并为其添加图像生成功能。","此次更新是 Bard 发展过程中的重要一步,它将使 Bard 更加易于使用和更具竞争力。","Gemini Pro 是 Google 目前最先进的 LLM。","Bard 在 Chabots Arena 排行榜上排名第二。","Bard 还获得了来自领先基准的新质量认可。"]
["Gemini Pro在常识推理任务中表现优异,斯坦福和Meta的研究认为Gemini被低估。","研究人员设计新测试集,发现Gemini在复杂推理任务中的表现较之前更强。","评估包括11个基于语言的数据集和一个多模态数据集,结果显示Gemini Pro与GPT-3.5相当。","GPT-4Turbo在整体性能上领先,但Gemini Pro在特定任务中略胜。","推理实验显示Gemini Pro和GPT-4Turbo在正确和错误答案上都表现出先进的推理机制。"]
["谷歌 Gemini Pro 大模型对开发者和企业开放","Gemini Pro 具有 32K 上下文窗口和生成功能,支持 38 种语言","提供多种 SDK 和 Google AI Studio 帮助开发者构建应用程序","用户可以免费访问 Gemini Pro 和 Gemini Pro Vision","Google 将推出更强大的模型 Gemini Ultra 并引入更多开发者平台"]
["谷歌发布Gemini Pro大型语言模型","Bard现在更聪明","Gemini Pro超越了GPT-3.5","用户可以免费体验搭载Gemini Pro的Bard","谷歌计划推出Bard Advanced提供多模态输入支持"]