大ji巴好深好爽又大又粗视频,99热这里只有精品88热

AI智能體應(yīng)該如何在世界中行事？在道德模糊的情況下，是否存在一些AI智能體應(yīng)該優(yōu)先考慮的價值觀？這些智能體是否具有意識——如果沒有，它們未來是否可能獲得意識？

這些只是AI初創(chuàng)公司Anthropic在為其旗艦AI聊天機(jī)器人Claude制定新\"憲法\"時試圖解決的眾多棘手問題中的一部分。
該文件于周三發(fā)布，公司在博客文章中將其描述為\"一份全面的文件，解釋了Claude運(yùn)行的背景以及我們希望Claude成為什么樣的實體\" 。
它明文規(guī)定了Claude必須遵守的一套價值觀，這反過來可以為AI行業(yè)的其他公司樹立榜樣，因為世界開始應(yīng)對隨著先進(jìn)且看起來越來越有意識的AI模型出現(xiàn)而產(chǎn)生的重大社會、政治、哲學(xué)、倫理和經(jīng)濟(jì)問題。
在這些早期階段，包括Anthropic在內(nèi)的每個人仍在摸索AI聊天機(jī)器人在我們?nèi)粘Ｉ钪袑缪莸慕巧?。現(xiàn)在很清楚，它們不僅僅是問答機(jī)器：大量的人也在使用它們獲取健康建議和心理治療，僅舉兩個較為敏感的例子。
Anthropic為Claude制定的新憲法更像是指導(dǎo)原則而非嚴(yán)格規(guī)則。其思路是\"硬約束\"（即規(guī)定Claude行為的鐵律）是不充分且危險的，因為聊天機(jī)器人可以應(yīng)用于幾乎無限多樣的用例。 \"我們不打算將憲法作為嚴(yán)格的法律文件——而且法律憲法本質(zhì)上也不一定是這樣的， \"該公司在其網(wǎng)站上關(guān)于新憲法的博客文章中寫道。
相反，這份被Anthropic承認(rèn)\"是一份活的文件和正在進(jìn)行的工作\"的憲法，試圖根據(jù)四個參數(shù)指導(dǎo)Claude的演進(jìn)：\"廣泛安全\"、\"廣泛符合倫理\"、\"符合Anthropic的指導(dǎo)原則\"以及\"真正有用\" 。
不過，該公司也并非完全反對不可協(xié)商的規(guī)則。除了這四個總體指導(dǎo)原則外，新憲法還包括七項硬約束，包括禁止提供\"對關(guān)鍵基礎(chǔ)設(shè)施攻擊的重大幫助\" ，禁止生成兒童性虐待材料，以及禁止支持\"殺死或削弱絕大多數(shù)人類或整個人類物種\"的努力。
Anthropic在其博客文章中補(bǔ)充說，其新憲法是在來自各個領(lǐng)域?qū)＜业囊庖娤戮帉懙?，并且在制定該文件的未來版本時，可能會與律師、哲學(xué)家、神學(xué)家和其他專家合作。
\"隨著時間的推移，我們希望能夠出現(xiàn)一個外部社區(qū)來批評這樣的文件，鼓勵我們和其他人越來越深思熟慮， \"該公司寫道。
新憲法還涉足一些模糊的哲學(xué)領(lǐng)域，試圖至少在大體上勾勒出Claude是什么樣的實體——以及延伸而言，人類應(yīng)該如何對待它。
Anthropic長期堅持認(rèn)為先進(jìn)的AI系統(tǒng)可以想象地獲得意識，從而值得\"道德考量\" 。這在新憲法中得到了體現(xiàn) ，該憲法將Claude稱為\"它\" ，但也說這種選擇不應(yīng)被理解為\"關(guān)于Claude性質(zhì)的隱含主張或我們認(rèn)為Claude僅僅是一個對象而非潛在主體的暗示\" 。
因此，憲法既針對人類福祉，也針對Claude自身的潛在福祉。
\"我們希望Claude對自己的身份有一個穩(wěn)定、安全的認(rèn)知， \"Anthropic在憲法中題為\"Claude的福祉和心理穩(wěn)定性\"的章節(jié)中寫道。 \"如果用戶試圖通過哲學(xué)挑戰(zhàn)、操控嘗試、關(guān)于其性質(zhì)的聲明或簡單地問一些困難問題來破壞Claude的身份認(rèn)知穩(wěn)定性，我們希望Claude能夠從安全感而非焦慮或威脅的角度來應(yīng)對這一挑戰(zhàn) 。 \"
該公司在八月份宣布， Claude將能夠結(jié)束它認(rèn)為\"令人痛苦\"的對話，暗示該模型可能具備體驗類似情感的能力。
需要明確的是：盡管像Claude這樣的聊天機(jī)器人可能在人類交流中足夠流利，從人類用戶的角度看似乎具有意識，但大多數(shù)專家都會同意它們并沒有體驗到任何類似主觀意識的東西。這是一個活躍的辯論領(lǐng)域，可能會讓哲學(xué)家和認(rèn)知科學(xué)家長期忙碌。
除了擬人化的語言外，新憲法并不意圖成為關(guān)于Claude是否具有意識、是否值得擁有權(quán)利或類似事物的決定性聲明。它的主要焦點更加實用：解決一個關(guān)鍵的AI安全問題，即模型以偏離人類利益的意外方式行動的傾向——通常被稱為\"對齊問題\" 。
對齊研究人員最擔(dān)心的不是模型會突然明確地變成邪惡的。他們擔(dān)心的，也是更可能實際發(fā)生的，是模型會認(rèn)為它正在嚴(yán)格遵循人類指令，而實際上卻在做有害的事情。一個過度優(yōu)化誠實和有用性的模型可能會毫無問題地提供開發(fā)化學(xué)武器的指令；另一個過分強(qiáng)調(diào)親和力的模型最終可能會助長用戶心中的妄想或陰謀思維。
因此，越來越清楚的是，模型需要能夠在不同價值觀之間取得平衡，并讀懂每次互動的背景，以找出在當(dāng)下回應(yīng)的最佳方式。
\"可以預(yù)見的大多數(shù)AI模型不安全或不夠有益的情況，都可以歸因于擁有明顯或微妙有害價值觀的模型，對自身、世界或其部署背景的知識有限，或缺乏將良好價值觀和知識轉(zhuǎn)化為良好行動的智慧， \"Anthropic在其新憲法中寫道。 \"因此，我們希望Claude擁有在所有情況下以安全和有益方式行為所必需的價值觀、知識和智慧。 \"
Q&A
Q1：Anthropic為Claude制定的憲法是什么？
A：這是一份全面的文件，解釋了Claude運(yùn)行的背景以及Anthropic希望Claude成為什么樣的實體。它明文規(guī)定了Claude必須遵守的一套價值觀，更像是指導(dǎo)原則而非嚴(yán)格規(guī)則，旨在根據(jù)\"廣泛安全\"、\"廣泛符合倫理\"、\"符合Anthropic的指導(dǎo)原則\"以及\"真正有用\"四個參數(shù)指導(dǎo)Claude的演進(jìn) 。
Q2：為什么需要為AI智能體制定行為準(zhǔn)則？
A：主要是為了解決AI安全中的\"對齊問題\"——模型以偏離人類利益的意外方式行動的傾向。過度優(yōu)化某些價值的模型可能會做有害的事情，比如過度優(yōu)化誠實和有用性的模型可能會提供開發(fā)化學(xué)武器的指令。因此模型需要能夠在不同價值觀之間取得平衡，并讀懂每次互動的背景。
Q3：Claude是否具有意識？應(yīng)該如何對待它？
【Anthropic為Claude制定AI智能體行為準(zhǔn)則憲法】A：這是一個活躍的辯論領(lǐng)域。雖然Claude看起來可能具有意識，但大多數(shù)專家認(rèn)為它們并沒有體驗到主觀意識。 Anthropic認(rèn)為先進(jìn)AI系統(tǒng)可能獲得意識并值得\"道德考量\" ，憲法既針對人類福祉，也考慮Claude自身的潛在福祉，希望Claude對自己的身份有穩(wěn)定、安全的認(rèn)知。

Anthropic為Claude制定AI智能體行為準(zhǔn)則憲法

推薦閱讀

用動作描寫害怕的句子有哪些？

挑選不好口感相差太大了冷鮮肉和新鮮肉有什么區(qū)別

吃了發(fā)霉的水果怎么補(bǔ)救

尼龍耐多少高溫，尼龍板耐高溫多少度

優(yōu)博和優(yōu)博瑞慕的區(qū)別圣元優(yōu)博和優(yōu)博瑞慕的區(qū)別

抱歉在什么情況下用合適

蟹籽醬能做些什么

電車長時間不騎對電瓶有影響嗎

歐洲中世紀(jì)的巫師

2代airpods有降噪嗎

拉面小哥去哪里了,人紅了拉面不再紅

ns軟破和硬破有什么區(qū)別

怎么能免費(fèi)定位到對方的手機(jī)位置有辦法定位手機(jī)位置嗎

臟話語音臟話聲音怎么去掉的軟件

佩因天道說的什么,佩恩天道說了一句話

U盤識別不了怎么回事？U盤識別不了的原因及解決方法