生成式人工智能引领自由职业市场新潮流

OpenAI 近日宣布,将其 ChatGPT 高级语音模式扩展到欧盟、瑞士、冰岛、挪威和列支敦士登等地区。该功能允许 ChatGPT 在232毫秒(平均320毫秒)内响应音频输入,可与人类在典型对话中的响应时间相媲美。ChatGPT 高级语音模式最初在今年5月推出,仅限于美国的 Plus 和 Team 用户。上个月,OpenAI 将这一功能扩展到了英国用户。现在,欧盟等地区的所有 ChatGPT Plus 和 Team 用户也可以使用这一功能。OpenAI 还宣布,ChatGPT 高级语音模式已经进行了多项改进,包括新增五种新的语音、自定义指令功能和对话
Cohere 发布了最先进的多模态 AI 搜索模型 Embed3—— 现在支持多模态搜索,这意味着用户不仅可以通过文本,还能通过图像进行企业级的检索。Embed3自去年推出以来,一直在不断优化,帮助企业将文档转化为数字化的表示形式,而这次的升级将让它在图像搜索方面表现更为出色。Cohere 的联合创始人兼首席执行官 Aidan Gonzales 在社交媒体上分享了 Embed3在图像搜索方面的性能提升图表。Cohere 在一篇博客中表示,这一新功能将帮助企业充分挖掘存储在图像中的海量数据,提升工作效率。企业可以
你是否曾想过,只需一台普通的摄像头,就能制作出媲美好莱坞大片的动画?Runway 最新推出的 Act-One 工具,让这个梦想变成了现实!这项革命性的技术,利用生成式 AI 模型,仅凭演员的视频和语音输入,就能生成栩栩如生的角色动画,彻底颠覆了传统的动画制作流程。以往,制作动画需要昂贵的动作捕捉设备、繁琐的面部建模和漫长的后期制作。而 Act-One 彻底简化了这一过程,只需一部家用摄像头录制演员的表演,就能捕捉演员的眼神、表情、动作和语气,并将其转化为虚拟角色的动画。这
近日,一款名为PodCastLM的工具正式推出,旨在帮助用户将PDF文档内容转换为适合音频播客的自然对话,并输出为MP3文件。该项目受NotebookLM工具的启发,通过处理文档内容,用户可以轻松生成音频形式的播客内容。PodCastLM结合了现代前端和后端技术,如React和FastAPI,提供了用户友好的界面和流畅的转换过程。用户只需上传PDF文档,选择合适的转换选项,PodCastLM就会自动将文档内容转换为音频播客。通过此工具,用户可以轻松创建原创音频内容,提升信息传播的效率和趣味性。PodCastLM适用于各
在近日举行的 Snapdragon Summit 活动上,高通正式发布了其 Snapdragon Elite 平台,专为汽车应用而设计。这一新平台搭载了高通最新的 Oryon 中央处理器,旨在为下一代汽车带来更智能的体验。这些平台作为高通数字底盘(Snapdragon Digital Chassis)的一部分,进一步丰富了其在汽车领域的技术布局。高通提供了两种主要平台选择:Snapdragon Cockpit Elite,专注于提供先进的数字驾驶舱体验;以及 Snapdragon Ride Elite,致力于实现自动驾驶能力。汽车制造商可以在同一芯片上灵活地结合这两种功能,为用户提供更
近日,OpenAI 宣布了一项重要的人事任命,前美国商务部首席经济学家亚伦・查特吉(Aaron Chatterji)成为公司首位首席经济学家。这位在乔・拜登总统任下工作的前经济学家,将为 OpenAI 的研究提供经济学视角,重点关注人工智能(AI)对经济增长和就业前景的影响。查特吉不仅有着丰富的政府工作背景,他还曾在巴拉克・奥巴马总统的经济顾问委员会担任高级经济学家。此外,他还是杜克大学商业与公共政策的教授,拥有深厚的学术基础和实践经验。加入 OpenAI 后,他将带领团队深入研究 AI 如