博通推出新一代低功耗AI芯片助力高速光网络

字节跳动 发布了一款名为 BAGEL 的开源多模态基础模型,拥有70亿个活跃参数,整体参数量达到140亿。BAGEL 在标准多模态理解基准测试中表现出色,超越了当前一些顶级开源视觉语言模型,如 Qwen2.5-VL 和 InternVL-2.5。此外,在文本到图像的生成质量上,BAGEL 的表现也与强大的专业生成器 SD3相媲美。更重要的是,BAGEL 在经典图像编辑场景中的效果优于许多领先的开源模型。BAGEL 采用了一种名为混合变换器专家(MoT)的架构,旨在最大化模型对多样化多模态信息的学习能力。它使用两个独立的编
在最新的公告中,京东宣布将免费向其 POP 商家推出五大人工智能(AI)营销产品。这一举措旨在帮助商家利用先进技术提升销售效果和运营效率。这些新工具包括直播数字人、商家客服智能体、短视频生成工具、京点点以及京麦 AI 助手,均为商家提供了更为高效的营销手段。京东数字人将为新客户提供免费版本。这一工具包含了五种时尚感和个性化的数字人,可以进行180分钟的合成直播。这些数字人不仅能够以低至真人1/10的成本进行直播,而且可以全天候不间断带货,效果超越80% 的真人
谷歌在I/O2025大会上宣布,NotebookLM将推出全新视频概览(Video Overviews)功能,允许用户通过上传的PDF、图片、文本等来源素材,自动生成动画风格的短片,深入浅出地讲解复杂内容。这一功能面向所有用户开放,首版仅支持英语,引发全球教育、科研和内容创作社区的热烈讨论。AIbase综合最新社交媒体动态,深入解析视频概览的技术亮点及其对AI辅助学习与创作的深远影响。视频概览:从静态素材到动画讲解NotebookLM的视频概览功能利用Gemini1.5Pro的多模态能力,将用户上传的PDF、图片、文本、
谷歌近日正式发布了 Project Astra 的最新功能,该项目展示了其强大的智能助理能力,能够控制 Android 手机。这一技术目前已经以应用程序的形式提供给受信任的测试者,并在 Pixel9Pro 上进行了演示。在演示中,用户在修理自行车的过程中,与 Astra 进行实时对话。用户首先请求 Astra 在线查找一份 PDF 手册,Astra 随后打开文档,并以悬浮气泡的形式展示其触控操作,同时界面发出亮光,以便用户可以清晰地看到其正在滚动到所需页面的过程。接着,Astra 打开了 YouTube 应用,进行视频搜索并播放
根据彭博社记者马克・古尔曼的最新报道,苹果公司正在积极筹备在其即将发布的 iOS19中向第三方开发者开放其人工智能(AI)模型。这一举措旨在促进软件开发,推动应用创新,并增强苹果自家硬件产品的吸引力。据了解,苹果正在研发一套软件开发工具包(SDK)及相关框架,以便开发者能够利用 Apple Intelligence 所采用的大型语言模型来创建新功能。这一计划预计将在即将到来的全球开发者大会(WWDC)上正式发布,时间定于6月9日。目前,Apple Intelligence 已经被应用于 iOS 和 macOS 的一些功能,
火山引擎正式推出豆包·语音播客模型,豆包·语音播客模型基于流式模型构建,能够实现从文本创作到双人对话式播客的秒级转化,为用户带来“低成本、高时效、强互动”的全新创作体验。这一模型的推出,不仅解决了传统AI播客创作中的诸多痛点,还极大地简化了播客制作流程,让热点内容能够瞬间转化为生动的播客。