最新の研究によると、DeepMindの大規模言語モデル(LLM)は、テキスト以外の分野、特に画像や音声データの圧縮において優れた性能を示すことが明らかになりました。
この研究により、LLMは単なるテキスト生成モデルではなく、強力なデータ圧縮器として再定義されることになります。
LLMの性能はデータセットのサイズに関連しますが、その巨大なサイズによって制限される面もあります。
海外メディアの報道によると、マイクロソフトの最高技術責任者であるケビン・スコット(Kevin Scott)氏は、大胆な予測として、2030年までにプログラミングコードの最大95%が人工知能によって生成されると述べています。しかし、彼は続けて、これがソフトウェアエンジニアリングにおける人間の関与の終焉を意味するわけではないと説明しました。スコット氏は、これはAIがソフトウェアエンジニアリングの仕事を請け負うという意味ではなく、依然として人間が作成者であると述べています。「AIは別の抽象レイヤーを作り出します。なぜなら、私たちは(プログラミング言語の)入力の達人から(AIを調整する)プロンプトの達人へと変わるからです。」と彼は述べています。
2025年4月4日、カリフォルニア州サンフランシスコ — 待ちに待ったMidjourney V7画像モデルが、昨日(4月3日)アルファテスト段階に正式入りしました。このニュースはMidjourney公式チャンネルを通じて発表され、この人工知能研究企業が画像生成技術分野で再び重要な一歩を踏み出したことを示しています。Midjourneyの創設者兼CEOであるDavid Holtz氏は、V7について「これまでで最高の…」と述べています。
先日、バイトダンス(ByteDance)は最新のAIプロジェクトであるDreamActor-M1を発表しました。これは動画生成技術に革新をもたらす最先端の成果です。このモデルは、静止画1枚と参考動作動画を組み合わせることで、写真中の人物を動画シーンにシームレスに置き換え、表情豊かで自然な動き、高画質の動画を生成できます。この技術の発表は、バイトダンスの生成AI分野における新たな飛躍を示すだけでなく、既存のアニメーション生成ツール(Runwayなど)への挑戦とも見なされています。
バイオテクノロジー分野において、人工知能の応用はタンパク質の発見と設計を急速に推進しています。最近、カリフォルニア大学バークレー校(UC Berkeley)とカリフォルニア工科大学(Caltech)の研究チームは、テキスト記述を利用してタンパク質設計を支援することを目的とした、ProteinDTと呼ばれる新しいマルチモーダルフレームワークを共同開発しました。この革新的な手法は、タンパク質の配列と構造情報だけでなく、テキスト形式で存在する大量の生物学的知識も統合し、タンパク質設計の新たな章を開きました。
テンセント元宝は「お気に入り」機能を全面的にアップグレードし、ユーザーに新たな知識管理と情報確認ソリューションを提供します。今回のアップグレードは、ユーザーエクスペリエンスの向上だけでなく、元宝の機能範囲を大幅に拡大し、よりスマートで便利なツールへと進化させました。