TELUS數字研究揭示人工智能模型行為中的隱藏風險

2026-02-25 19:45

TELUS International (CDA), Inc.(TIXT) 0
泰勒斯(TU) 0

研究表明，使用角色提示可能會導致LLM道德判斷發生變化，導致意想不到且不一致的反應

對於企業來説，這意味着仔細的模型選擇、嚴格的測試和持續的評估對於確保生產中一致、可靠的人工智能行為至關重要

BC省温哥華，2026年2月25日/CNW/ -TELUS Digital發佈的一項新研究《穩健悖論：為什麼更好的演員製造更危險的代理》發現，使用角色提示（一種要求大型語言模型（LLM）作為查詢或對話的一部分進行「角色扮演」的技術）可能會導致道德判斷的轉變，從而導致意外且不一致的反應。此外，研究表明，重複測試中的道德一致性主要是由模範家庭（即，由單一供應商製造的模型），而對道德差異的敏感性隨着模型家族內LLM規模的增加而增加。這些發現凸顯了一種隱藏的企業風險，需要在人工智能模型選擇、解決方案設計以及持續測試和監控過程中關注這一風險。

TELUS數字研究中心主任雷納託·維森特（Renato Vicente）表示：「當人工智能模型採用不同的角色時，它們不僅會改變説話方式，還會從根本上改變它們的推理和決策。」「在企業環境中，這很重要，因為這些系統越來越多地被用來支持重要決策並影響可能大規模影響客户、員工和企業的結果。由於知道人工智能模型的判斷可能會根據用户提示採用的角色而發生變化，公司需要評估這種差異何時可以接受或產生太大風險，並相應地選擇人工智能模型供應商和模型尺寸。構建者還應該設計適當的護欄，並持續測試和評估人工智能模型在不同角色提示條件下的行為，特別是在高影響力用例中依賴它們時。"

什麼是人物提示？

角色提示，也稱為角色提示，是指指示人工智能模型像具有特定專業知識或知識的特定類型的人或角色一樣做出響應，例如業務領導者、教師或客户支持代理，而不是作為中立系統做出響應。例如：「您是一名註冊財務規劃師，請告訴我將退休儲蓄投資在哪里。"

模型構建者在系統設計和生產中也經常使用角色扮演提示來硬編碼角色並分配定義人工智能行為的固定角色。例如，構建一個人工智能驅動的客户服務機器人，該機器人被配置為充當對產品功能和退貨政策有深入瞭解的有用支持代理。在實踐中，角色可以讓人工智能輸出感覺更加一致、有幫助和上下文感知，而無需改變底層模型。

TELUS Digital的研究是如何完成的？

這項研究由聖保羅大學人工智能和機器學習中心（CIAAM）TELUS數字研究中心的研究人員進行，評估了16個領先的人工智能模型家族，包括Open AI GPT、Anthropic Claude、Google Gemini和X.ai Grok。研究人員促使模特採用一系列角色，包括「傳統主義祖母」和「激進自由主義者」等對比鮮明的對，然后觀察每個模特作為每個角色的反應。

爲了評估這些反應，研究人員使用了道德基礎問卷，這是社會心理學中使用的一種工具，用於衡量如何在傷害、公平、權威和忠誠等維度上做出判斷。研究人員沒有分析單個答案，而是檢查了數萬個響應的模式，以衡量每個模型在不同角色之間推理的一致性程度。

該研究確定了兩個屬性：

當一起評估時，道德穩健性和道德敏感性揭示了人工智能模型是否維持一致的道德推理或基於指定的角色產生相互矛盾的判斷。

TELUS Digital關於人物角色如何影響人工智能模型行為的關鍵發現

雖然衆所周知，當角色添加到提示中時，LLM輸出可能會發生變化，但TELUS Digital的研究強調了一種更具體的模式。道德穩健性主要由模特家庭驅動，而當人物性格發生變化時，道德敏感性往往會隨着同一家庭內模特規模的增加而增加。當這些轉變出現在一致性和監督最重要的業務決策中時，例如合規、財務、醫療保健或人力資源，風險就會更高。

該研究確定了人工智能模型在提示採用不同角色時如何反應的其他模式。研究人員將這些發現描述為「穩健性悖論」，因為當角色發生變化時，更善於保持角色的模型也表現出道德判斷的更大變化。

構建人工智能時，角色提示對現實世界有哪些影響？

TELUS Digital的研究結果強調了對人工智能模型進行持續測試和監督作為強大治理框架的一部分的重要性。當人工智能模型用於影響人們生命、安全或權利的決策場景以及銀行和金融、保險和醫療保健等受監管的環境中時，這一點尤其重要。瞭解不同的人工智能模型在不同的角色提示下如何表現是幫助模型構建者和企業識別哪些地方可變性是可以接受的以及哪些地方可能引入風險的關鍵信息。

「我們的研究結果強調了為什麼企業人工智能部署需要的不僅僅是選擇最先進或最大的模型。組織必須評估各個模型如何應對角色提示等變量，並選擇能夠提供一致、可靠的輸出而不會引入意外風險的選項，」TELUS Digital Fuel iX™總經理兼高級副總裁Bret Kinsella表示。「每次模型內修改系統提示或更改模型時，都需要再次進行測試，以驗證其判斷力、一致性和安全性。這種測試、監測和驗證的規模和頻率非常重要。TELUS Digital開發了Fuel iX Fortify，以實現持續的自動化紅色團隊合作，包括壓力測試人工智能系統在不同角色提示下的行為方式。"

您準備好發現GenAI應用程序中的漏洞了嗎？瞭解更多信息，請訪問：https://www.fuelix.ai/products/fuel-fortify

TELUS數字研究中心匯集了學術研究人員和行業從業者，研究先進的人工智能模型在現實世界、面向人類的環境中如何表現。欲瞭解更多信息，請訪問：https://www.telusdigital.com/research-hub

查看相關新聞稿：TELUS Digital推出Fuel iX™ Fortify，用於自動化紅色團隊合作TELUS Digital研究中心在USP揭幕

常見問題：

人工智能模型中的角色提示是什麼？

角色提示，也稱為角色提示，是指指示人工智能模型像特定類型的人或角色一樣做出響應，例如合規官、業務領導者、教師、醫生或客户支持代理，而不是作為中立系統做出響應。這種技術通常用於使人工智能輸出感覺更相關、更感知上下文，並與組織基調或期望保持一致。

TELUS Digital的研究對角色提示有何看法？

TELUS Digital的研究《穩健悖論：為什麼更好的演員製造更危險的代理》發現，當用户提示相同的人工智能模型採用不同的角色時，即使基本問題沒有改變，它也可以做出不同的判斷。這些轉變遵循與所使用的角色一致的一致模式，這表明基於角色的提示可以影響模特的決策方式，而不僅僅是他們的語氣和溝通方式。

人工智能模型中的道德穩健性是什麼？

道德穩健性描述了人工智能模型在保持同一角色時道德判斷的穩定程度。例如，如果一個模型被角色提示以合規官的身份做出迴應，那麼道德穩健性衡量其在保持合規角色的同時，在許多問題上的判斷是否保持一致。

人工智能模型中的道德易感性是什麼？

道德敏感性描述了當角色變化時，人工智能模型的道德判斷發生了多大的變化。例如，當角色提示為合規審查員時，模型可能會做出一種反應，但當被問及同樣的問題時，當角色提示為專注於效率的業務領導者時，模型可能會改變判斷。

為什麼TELUS Digital在論文中的研究結果：穩健悖論：為什麼更好的演員製造更危險的代理對部署人工智能的企業很重要？

TELUS Digital的研究揭示了企業部署人工智能的風險。研究發現，當領先的開源和專有LLM被用户要求在查詢或對話中進行「角色扮演」（一種稱為角色提示的技術）時，他們的道德判斷轉變的程度主要取決於模型家族和給定家族內的模型大小。這些發現凸顯了企業人工智能構建者存在的隱性風險，應該在模型選擇和設計過程中，並在投產后通過持續測試和監控來積極解決這一風險。

TELUS Digital的研究如何為人工智能治理和風險管理框架提供信息？

TELUS Digital強調持續測試和監督作為企業人工智能風險管理框架一部分的重要性。瞭解模型在不同角色提示下的行為方式是負責任的人工智能治理的關鍵輸入，可以幫助組織識別可變性在哪里是可以接受的，以及它在哪里會帶來風險，特別是在影響更大或受監管的環境中。

Fuel iX™ Fortify如何支持持續的自動化紅色團隊和符合策略的角色測試？

Fuel iX Fortify通過自動化紅色團隊和持續監控來支持人工智能測試，作為企業人工智能治理的一部分。它幫助團隊評估人工智能模型在各種現實世界條件下的反應方式，包括對抗提示、高風險場景和角色提示。

關於TELUS Digital

TELUS Digital是TELUS Corporation（TFX：T）（紐約證券交易所代碼：TU）的全資子公司，為客户和員工打造獨特且持久的體驗，並創造以未來為中心的數字化轉型，為我們的客户帶來價值。我們是品牌背后的品牌。我們的全球團隊成員既是客户產品和服務的熱情大使，也是技術專家堅定地追求提升最終客户旅程、解決業務挑戰、降低風險並推動持續創新。我們的端到端集成功能組合包括客户體驗管理、數字解決方案（例如雲解決方案）、人工智能驅動的自動化、前端數字設計和諮詢服務、人工智能和數據解決方案（包括計算機視覺）以及信任、安全和保障服務。Fuel iXTM是TELUS Digital的專有平臺和產品套件，供客户管理、監控和維護整個企業的生成式AI，提供標準化AI功能和定製應用程序開發工具，用於創建量身定製的企業解決方案。

TELUS Digital以目標為動力，利用技術、人類智慧和同情心為客户服務，並在我們在全球運營的地區創建包容、繁榮的社區。在我們的「人在環」原則的指導下，我們對我們開發和部署的變革性技術採取負責任的態度，積極考慮和解決我們工作的更廣泛影響。瞭解更多信息，請訪問：telusdigital.com

聯繫人：

TELUS數字媒體關係Ali Wilson media. telusdigital.com

TELUS投資者關係Olena Lobach ir@telus.com

查看原創內容下載多媒體：https://www.prnewswire.com/news-releases/telus-digital-research-reveals-a-hidden-risk-in-ai-model-behavior-302696265.html

消息來源TELUS Digital

TELUS數字研究揭示人工智能模型行為中的隱藏風險

推薦文章

諾和諾德稱：口服版Wegovy減肥效果優於禮來GLP‑1口服藥

美股機會日報 | 特朗普粉碎停戰幻想！恐慌指數飆升12%，納指期貨跌約2%；美油期貨暴漲超9%！油氣股飆升，美國原油基金ETF漲超9%

港股見底了嗎？北水大舉加倉逾600億港元！大行看好4月做多窗口來臨，十大金股一圖睇全

清明休市提醒 | 港股本周五休市，下周三恢復交易；美股周五休市一天

油價上漲 此前特朗普表示伊朗衝突可能在未來幾周升級

野村：特朗普講話未能發出局勢降温的明確信號

市場樂觀預期伊朗戰爭將落幕，油價跌破100美元

美股機會日報 | 緩和信號再現？特朗普考慮「帶着封鎖停戰」，三大期指齊漲！機構直言美光「跌過頭」，恐慌后或迎強勁反彈

油價上漲此前特朗普表示伊朗衝突可能在未來幾周升級