潘多拉魔盒：無限制大模型如何威脅加密行業安全？背景

中級

6/10/2025, 1:50:06 AM

隨着開源大模型的泛濫，WormGPT、FraudGPT 等“無限制 AI 工具”正被濫用於生成釣魚郵件、編寫惡意合約、操縱用戶社群，嚴重威脅加密行業安全。本文詳解這些模型的原理、用途及應對策略，爲 Web3 從業者敲響警鍾。

從 OpenAI 的 GPT 系列到谷歌的 Gemini，再到各類開源模型，先進的人工智能正在深刻重塑我們的工作與生活方式。然而，技術飛速發展的同時，一個值得警惕的陰暗面也逐漸浮現 —— 無限制或惡意大型語言模型的出現。

所謂無限制 LLM，是指那些被特意設計、修改或“越獄”，以規避主流模型內置的安全機制與倫理限制的語言模型。主流 LLM 開發者通常會投入大量資源，防止其模型被用於生成仇恨言論、虛假信息、惡意代碼，或提供違法活動的指令。但近年來，一些個人或組織出於網路犯罪等動機，開始尋找或自行開發不受限制的模型。鑑於此，本文將盤點典型的無限制 LLM 工具，介紹它們在加密行業中的濫用方式，並探討相關的安全挑戰與應對之道。

無限制 LLM 如何作惡？

過去需要專業技術才能完成的任務，如編寫惡意代碼、制作釣魚郵件、策劃詐騙等，如今在無限制 LLM 的輔助下，即使毫無編程經驗的普通人也能輕鬆上手。攻擊者只需獲取開源模型的權重與源碼，再在包含惡意內容、偏見言論或非法指令的數據集上進行微調(fine-tuning)，就能打造出定制化的攻擊工具。

這種模式催生了多個風險隱患：攻擊者可依據特定目標“魔改”模型，生成更具欺騙性的內容，進而繞過常規 LLM 的內容審查與安全限制；模型還能被用來快速生成釣魚網站的代碼變體，或爲不同社交平台量身定制詐騙文案；與此同時，開源模型的可獲取性與可修改性也在不斷助長地下 AI 生態的形成與蔓延，爲非法交易與開發提供了溫牀。以下是對這類無限制 LLM 的簡要介紹：

WormGPT：黑色版 GPT

WormGPT 是一個在地下論壇公開售賣的惡意 LLM，其開發者明確宣稱它沒有任何道德限制，是 GPT 模型的黑色版。它基於如 GPT-J 6B 等開源模型，並在與惡意軟件相關的大量數據上訓練。用戶最低只需支付 189 美元，即可獲得一個月的使用權限。WormGPT 最臭名昭著的用途是生成高度逼真且具有說服力的商業郵件入侵(BEC) 攻擊郵件和釣魚郵件。其在加密場景中的典型濫用方式包括：

生成釣魚郵件/信息：模仿加密貨幣交易所、錢包或知名項目方向用戶發送“帳戶驗證”請求，誘導其點擊惡意連結或泄露私鑰/助記詞；
編寫惡意代碼：協助技術水平較低的攻擊者編寫竊取錢包文件、監控剪貼板、記錄鍵盤等功能的惡意代碼。
驅動自動化詐騙：自動回復潛在受害者，引導其參與虛假空投或投資項目。

DarkBERT：暗網內容的雙刃劍

DarkBERT 是由韓國科學技術院(KAIST) 的研究人員與 S2W Inc. 合作開發的語言模型，專門在暗網數據（如論壇、黑市、泄露資料）上進行預訓練，初衷是爲網路安全研究人員和執法機構更好地理解暗網生態、追蹤非法活動、識別潛在威脅和獲取威脅情報。

盡管 DarkBERT 的設計初衷是正向的，但其掌握的關於暗網上的數據、攻擊手段、非法交易策略等敏感內容，如果被惡意行爲者獲取或利用類似技術訓練出無限制大模型，後果不堪設想。其在加密場景中的潛在濫用方式包括：

實施精準詐騙：收集加密用戶與項目團隊的信息，用於社工欺詐。
模仿犯罪手法：復刻暗網中成熟的盜幣與洗錢策略。

FraudGPT：網路欺詐的瑞士軍刀

FraudGPT 宣稱是 WormGPT 的升級版，功能更全面，主要在暗網與黑客論壇中銷售，月費從 200 美元至 1,700 美元不等。其在加密場景中的典型濫用方式包括：

僞造加密項目：生成以假亂真的白皮書、官網、路線圖與營銷文案，用於實施虛假 ICO/IDO。
批量生成釣魚頁面：快速創建模仿知名加密貨幣交易所登入頁面或錢包連接界面。
社交媒體水軍活動：大規模制造虛假評論與宣傳，助推詐騙代幣或抹黑競爭項目。
社會工程攻擊：該聊天機器人可以模仿人類對話，與不知情的用戶建立信任，誘使他們無意中泄露敏感信息或執行有害操作。

GhostGPT：不受道德約束的 AI 助手

GhostGPT 是一個被明確定位爲無道德限制的 AI 聊天機器人，其在加密場景中的典型濫用方式包括：

高級釣魚攻擊：生成高度仿真的釣魚郵件，冒充主流交易所發布虛假 KYC 驗證請求、安全警報或帳戶凍結通知。
智能合約惡意代碼生成：無需編程基礎，攻擊者便可借助 GhostGPT 快速生成包含隱藏後門或欺詐邏輯的智能合約，用於 Rug Pull 騙局或攻擊 DeFi 協議。
多態加密貨幣竊取器：生成具備持續變形能力的惡意軟件，用於竊取錢包文件、私鑰和助記詞。其多態特性使傳統基於籤名的安全軟件難以檢測。
社會工程學攻擊：結合 AI 生成的話術腳本，攻擊者可在 Discord、Telegram 等平台部署機器人，誘導用戶參與虛假 NFT 鑄造、空投或投資項目。
深度僞造詐騙：配合其他 AI 工具，GhostGPT 可用於生成僞造加密項目創始人、投資人或交易所高管的語音，實施電話詐騙或商業郵件入侵(BEC) 攻擊。

Venice.ai：無審查訪問的潛在風險

Venice.ai 提供對多種 LLM 的訪問，包括一些審查較少或限制寬松的模型。它將自身定位爲用戶探索各種 LLM 能力的開放門戶，提供最先進、最準確且未審查的模型，以實現真正無限制的 AI 體驗，但也可能被不法分子用於生成惡意內容。該平台的風險包括：

繞過審查生成惡意內容：攻擊者可借助平台中限制較少的模型生成釣魚模板、虛假宣傳或攻擊思路。
降低提示工程門檻：即便攻擊者不具備高深“越獄”提示技巧，也能輕鬆獲得原本受限的輸出。
加速攻擊話術迭代：攻擊者可以利用該平台快速測試不同模型對惡意指令的反應，優化欺詐腳本和攻擊手法。

寫在最後

無限制 LLM 的出現，標志着網路安全面臨着更復雜、更具規模化和自動化能力的攻擊新範式。這類模型不僅降低了攻擊門檻，還帶來了更隱蔽、欺騙性更強的新型威脅。

在這場攻防持續升級的博弈中，安全生態各方唯有協同努力，方能應對未來風險：一方面，需要加大對檢測技術的投入，研發能夠識別和攔截惡意 LLM 所生成的釣魚內容、智能合約漏洞利用和惡意代碼；另一方面，也應推動模型防越獄能力的建設，並探索水印與溯源機制，以便在金融和代碼生成等關鍵場景中追蹤惡意內容來源；此外，還需建立健全的倫理規範與監管機制，從根源上限制惡意模型的開發和濫用。