アリババは最近、QVQ-72Bという新しいマルチモーダル推論モデルを発表しました。このモデルはQwen2-VL-72Bをベースに構築されており、強力な言語能力と視覚能力を融合することで、より複雑な推論と分析タスクを処理できます。これは、アリババが多モーダルAI分野で新たなブレークスルーを達成したことを示しています。



アリババは最近、QVQ-72Bという新しいマルチモーダル推論モデルを発表しました。このモデルはQwen2-VL-72Bをベースに構築されており、強力な言語能力と視覚能力を融合することで、より複雑な推論と分析タスクを処理できます。これは、アリババが多モーダルAI分野で新たなブレークスルーを達成したことを示しています。


Qwenチームは先日、最新開発のマルチモーダル推論モデルQVQのオープンソース化を発表しました。これは、人工知能における画像理解と複雑な問題解決能力において重要な一歩を踏み出したことを意味します。このモデルはQwen2-VL-72Bをベースに構築されており、言語と視覚情報を組み合わせることでAIの推論能力を向上させることを目指しています。MMMU評価において、QVQは70.3の高得点を獲得し、また複数の数学関連ベンチマークテストにおいて、Qwen2-VL-72B-Instructと比較して顕著な性能向上を示しました。
最近、Molmoというオープンソースの多モーダルAIモデルが業界で大きな注目を集めています。OpenAIのCLIPをビジョン処理エンジンとして使用し、Qwen2-72BをベースとしたこのAIシステムは、その優れた性能と革新的な機能で、従来の商用モデルの覇権に挑戦しています。Molmoの顕著な特徴はその高い性能です。比較的サイズが小さいにもかかわらず、処理能力は10倍規模の競合他社に匹敵します。この小さくても強力な設計思想は、モデルの効率性を高めることに貢献しています。
ドイツのフラウンホーファー工程・包装研究所の研究チームが、OWSumという人工知能による分子臭気予測アルゴリズムを開発し、アメリカンウイスキーとスコッチウイスキーを区別することに成功しました。その精度は人間の専門家を上回っています。チームはウイスキーの味覚記述と化学データを用いてこのAIツールを訓練し、ウイスキー識別における可能性を探っています。画像注記:画像はAI生成、画像ライセンス提供元はMidjourney。研究では16種類のサンプルを使用しました。
タイ工業省は先日、オンラインプラットフォームで販売されている模倣品・偽造品の監視強化のため、人工知能(AI)システムを導入すると発表しました。工業省のアカナート・プロムパン次官のポンポル・ヨドムアンチャロエン秘書官は水曜日、同省の技術・産業改革革新委員会が12月20日の会議でこの計画を議論したと述べました。12月20日の2回目の会議で委員会は、工業省のAIシステムが1日に10万件の商品の監視と検出が可能であることを示す調査結果を理解しました。
工業情報化部、国務院国有資産監督管理委員会、全国工商聯が『製造業企業のデジタルトランスフォーメーション実施ガイドライン』を発表。製造業企業のデジタルトランスフォーメーション推進は体系的な事業であり、企業の発展の実情を起点とし、企業の抱える問題解決を目標とし、全要素生産性向上を方向とし、シナリオのデジタル化を切入点として、技術の成熟度、経済的実現可能性、事業モデルの持続可能性を総合的に考慮し、デジタルトランスフォーメーションの優先分野と重点方向を的確に特定する必要があると規定。その中で、生産工程の推進について言及している。