最近,科學家們發現一個“逆轉詛咒”的現象——大模型無法進行逆向推理。論文通過虛擬和真實場景實驗表明,不管體量大小,頂流大模型都存在這個bug。這暴露了大模型邏輯推理能力的侷限,可能影響重要應用領域,存疑其可靠性。基於大模型的AI應用日益廣泛,逆轉詛咒警示人們不要對其可靠性過於樂觀。
大模型推理bug!問題翻轉回答全錯 GPT到Llama無一倖免

最近,科學家們發現一個“逆轉詛咒”的現象——大模型無法進行逆向推理。論文通過虛擬和真實場景實驗表明,不管體量大小,頂流大模型都存在這個bug。這暴露了大模型邏輯推理能力的侷限,可能影響重要應用領域,存疑其可靠性。基於大模型的AI應用日益廣泛,逆轉詛咒警示人們不要對其可靠性過於樂觀。
據第一財經消息,字節跳動正在加強內部數據安全管控,並推動自研AI工具的內部應用。近日字節跳動安全與風控部門發佈內部郵件,宣佈出於防範數據泄露風險考慮,將自6月30日起分批次禁用第三方AI開發軟件。此次禁用的第三方AI開發軟件包括目前市場上頗受歡迎的AI編程工具Cursor、Windsurf等。這些工具在開發者羣體中擁有較高使用率,但字節跳動選擇將其全面替換爲自研產品。字節跳動提出的替代方案是其自主研發的編程助手Trae。該工具於今年3月正式發佈,被定位爲國內首個AI原生IDE
雷鳥創新近日舉行新品發佈會,一口氣推出了AR眼鏡雷鳥X3Pro、新一代口袋電視雷鳥Air3s系列,以及AI拍攝眼鏡雷鳥V3Slim等多款重磅產品,全面佈局AR生態系統。旗艦AR眼鏡X3Pro:技術突破與生態融合作爲本次發佈會的重頭戲,雷鳥X3Pro AR眼鏡在技術層面實現了多項突破。該產品搭載全球最小可量產全綵Micro-LED光引擎,並與應用材料公司聯合研發納米光刻刻蝕RayNeo光波導技術,能夠呈現43英寸全綵3D空中透明屏顯示效果。在硬件配置上,X3Pro搭載第一代驍龍AR1平臺和獵鷹影像Plus系統,在提供強大AI
騰訊發佈了一款創新技術 ——HunyuanVideo-Avatar 語音數字人模型,並將其開源。這一技術能夠僅憑一張圖片和一段音頻,生成自然、真實的數字人說話或唱歌視頻,標誌着短視頻創作進入了全新階段。HunyuanVideo-Avatar 模型的核心功能在於其智能理解能力。用戶只需上傳一張人物圖像和相應的音頻,模型便能自動分析音頻中的情感和人物所處環境。例如,如果上傳一張在海灘上彈吉他的女性的照片,並搭配抒情音樂,模型將自動生成一段該女性在彈唱的動態視頻,展現自然的表情、脣形同步及
近日,英國科技初創公司 Builder.ai 因財務問題正式啓動破產程序。這家曾被認爲是獨角獸的公司,在不到兩年的時間裏便燒光了超過5億美元的投資資金,揹負着對亞馬遜8500萬美元和微軟3000萬美元的鉅額債務。Builder.ai 的倒閉引發了人們對人工智能在軟件開發中的真實應用的反思。圖源備註:圖片由AI生成,圖片授權服務商MidjourneyBuilder.ai 成立於兩年前,迅速在科技圈嶄露頭角,獲得了微軟等科技巨頭的支持,並在 D 輪融資中成功籌集到2.5億美元,估值一度接近10億美元。然而,隨着時間的
近日,微軟研究院宣佈開源其 Aurora AI 氣象預報模型。這一模型結合了深度學習和大規模數據處理技術,旨在爲氣象預報和環境監測提供精準的解決方案。Aurora AI 不僅能夠高效預測天氣,還可以經過微調後應用於洋流和空氣質量監測等多個領域。據微軟團隊在《Nature》期刊上發表的研究論文,Aurora 模型使用了超過100萬小時的多來源氣象與環境數據進行訓練。這些數據來源包括衛星、雷達、氣象站和計算機模擬等。微軟的研究表明,在2022至2023年間的全球熱帶氣旋預測中,Aurora 模型的軌跡預
近日,由清華大學、騰訊混元、斯坦福大學及卡耐基梅隆大學的研究團隊聯合發佈了一項新評估基準 ——RBench-V,專門針對多模態大模型的視覺推理能力進行測試。該基準的推出,旨在填補當前評估體系中對模型視覺輸出能力的空白,以便更全面地瞭解現有模型的性能。RBench-V 基準測試包含803道題目,涉及多個領域,包括幾何與圖論、力學與電磁學、多目標識別和路徑規劃等。與以往只要求文字回答的評估不同,這次評測特別要求模型生成或修改圖像內容,以支持推理過程。這意味着,模