全能型应用 AIdea:支持 GPT、国产大模型以及图像生成

微软在Windows11中计划推出“智能媒体搜索”功能,允许用户通过口语搜索已索引的本地视频或音频文件。此功能需用户同意扫描设备上的媒体文件,并在后台下载、安装AI模型进行转录和索引。目前功能仍在开发中,AI模型可能需要专用神经处理单元来处理运算。用户能否选择特定文件进行搜索仍有待明确,隐私问题因AI全面扫描媒体内容而引起关注。如果允许用户选择性处理,此功能可应用于会议或简报的高效转录,类似于Otter.ai等第三方云服务。
在游戏开发领域,大模型逐渐成为不可或缺的“智囊团”,从AI角色生成到场景构建,展现全面能力。然而,游戏场景理解、图像识别与内容描述仍需提升。加拿大阿尔伯塔的研究团队推出开源大模型VideoGameBunny(VGB),针对游戏开发优化,具备多语言支持、高度可定制性、强大的文本生成能力、开源易访问性、兼容多种开发环境、丰富的模型文件和活跃社区支持。VGB支持多种功能,如游戏对话系统、教育应用、客服聊天机器人等。其核心组件Bunny模型,通过多层感知器网络将视觉信息转换为图像标记,高效处理游戏数据。通过与Meta开源LLama-3-8B结合使用SigLIP视觉编码器和S2包装器,VGB能够捕捉游戏视觉内容的多尺度特征,理解游戏环境,并生成匹配游戏图像的指令数据,如简短和详细的标题、图像到JSON的描述及基于图像的问答,从而提升游戏的互动性和沉浸感,成为开发者和玩家的强大助手。
OpenAI已选定台积电的1.6nm芯片工艺作为其主要供应商,这标志着其在人工智能硬件领域的重大战略升级,预计2026年开始大规模生产,将显著提升其技术性能。通过与博通和Marvell的合作,OpenAI计划在2024或2025年开发专用于AI应用的ASICs,基于台积电的3nm工艺系列。此外,苹果计划在新iPhone中集成OpenAI的AI解决方案,并可能对OpenAI进行大额投资,目标估值高达1000亿美元。这将影响苹果与谷歌之间的搜索服务协议,目前谷歌每年需支付苹果费用以保持在iOS设备上的默认搜索引擎地位。OpenAI还推出了一项名为SearchGPT的新AI搜索功能,旨在结合AI模型与网络信息,提供快速准确的信息搜索服务。
SparkLabs宣布完成5000万美元新基金"AIM AI Fund"的募资,旨在支持全球AI初创企业及沙特阿拉伯的AIM-X加速器项目。该基金将投资50至70家AI公司,其中约35%用于加速器参与者,65%投资A轮和B轮项目。新基金反映了AI领域的投资热潮,尤其在生成式AI兴起背景下,沙特阿拉伯等新兴市场展现出潜力。SparkLabs通过该基金在全球范围内投资优秀AI初创企业,尤其是在美国,同时也为沙特阿拉伯和中东北非地区分配部分投资。该基金已投资14家AI初创公司,覆盖从视频分析、人工智能内容创作到AI旅游等多个领域。
SparkLabs宣布成立规模达5000万美元的AIM AI Fund,旨在进一步投资全球AI初创企业。该基金将重点支持位于沙特阿拉伯的AIM-X加速器内的AI项目,并关注全球其他地区的AI创业。随着AI领域的投资热情高涨,新基金计划通过该加速器投资10%-20%的沙特或中东地区项目,其余投资则集中在全球最优秀的AI初创企业。SparkLabs计划通过此基金投资50到70家公司,包括对加速器参与者的平均投资额20万美元,以及对A轮和B轮投资的100万到500万美元。虽然未透露具体有限合伙人信息,但已透露包括一个政府基金在内的参与方。SparkLabs已在14家初创公司上完成首次投资,涵盖多个行业和地区。
随着开学季的到来,钉钉推出了全面升级的“新生入学方案”,旨在通过智能化手段为学校管理减负增效,打造智慧、和谐的教育环境。该方案覆盖新生入学、分班到毕业信息管理等关键环节,提供一站式服务,助力学校与家庭的无缝对接。