正文

研究：AI 模型仍不擅長生成乾淨代碼 GPT-4 的 API 誤用率達 62%

發布於AI新閒資訊

時間 :Aug 30, 2023

閱讀 :1分鐘

計算機科學家對幾個大型語言模型在 StackOverflow 的 Java 編碼問題上的回答進行了評估，結果發現這些模型的代碼質量仍然不盡如人意。研究人員收集了 1208 個 StackOverflow 上的 Java 編碼問題，這些問題涉及 24 個常見的 Java API。然後他們用 4 個可生成代碼的大型語言模型進行了回答，並根據自己開發的 API 檢查器 RobustAPI 對回答進行評估。結果顯示，GPT-3.5 和 GPT-4 的 API 誤用率分別達到 49.83% 和 62.09%。研究認爲，大型語言模型代碼生成能力的提升與代碼可靠性和穩健性之間存在明顯差距，仍有改進的空間。

印度要求科技公司獲得政府批准發佈 AI 模型

["印度新政策要求科技公司發佈 AI 模型前需政府批准。","科技公司需確保產品不產生偏見、歧視或威脅選舉過程的公正性。","行業對印度政策轉變感到擔憂，擔心影響全球競爭力。"]

Mar 4, 2024

116.1k

谷歌發佈多模態大模型 Gemini 1.0 預計明年初向開發者推出

["Gemini 是 Google 推出的最新一代 AI 模型，具有多模態的能力。","Gemini 分爲三種規模：Ultra、Pro 和 Nano，適用於不同的任務和設備。","Gemini 在性能方面表現出色，在多項基準測試中超越了其他模型。","Gemini 具備多模態推理能力和編碼能力，可處理文本、圖像、音頻等信息。","Gemini 將在明年初向開發者和企業客戶推出，有望應用於 Google 產品中。"]

Dec 7, 2023

95.5k

調查：57% 受訪者認爲人工智能提高代碼質量

["42% 的調查參與者已經在軟件開發過程中使用人工智能","57% 的受訪專業人士認爲人工智能提高了代碼質量","46% 的受訪者表示工作滿意度有所提高","44% 的調查參與者指出人工智能節約了成本"]

Dec 6, 2023

131.0k

生成一張 AI 圖像所消耗能源相當於給手機充滿電

["使用 AI 生成圖像、撰寫電子郵件或向聊天機器人提問都會對地球造成一定負擔","使用 AI 生成一張圖像消耗的能源相當於給手機充滿電","生成文本的能源消耗較低，生成 1000 次文本只消耗手機充電量的 16%","大型生成 AI 模型的使用比小型模型更能耗"]

Dec 1, 2023

133.9k

LAION 呼籲歐盟鼓勵開源 AI 模型應用

["AI 組織 LAION 和領先的 AI 開發者建議歐盟鼓勵使用開源 AI 模型","開源 AI 模型具有更大的安全性、問責制、可複製性和魯棒性","LAION 推出了用於中型語言模型訓練的 PyTorch 代碼庫 OpenLM","OpenLM 模型表現優於類似開源模型","LAION 呼籲歐盟監管努力應鼓勵開源 AI 模型的應用"]

Sep 27, 2023

96.3k

智啟未來，您的人工智能解決方案智庫