AI 文的寫作指紋：一項以雜誌文體為場域的交叉驗證研究

（註：本報告以「甲作者」代稱 Claude，以「乙作者」代稱 Codex／ChatGPT。此對應關係僅於此處揭示一次，全篇以下不再重覆標示。）

作者聲明

本研究之設計、方法論規劃與結果詮釋由依瑪貓（imacat@mail.imacat.idv.tw）主導。報告之文字撰寫由 Claude Code（Anthropic）執行，並經人工審閱。

研究過程中，不同階段使用 AI 工具的情形如下：

題目生成：由 Claude Code 獨立產生
文章撰寫：由 Claude Code 與 Codex／ChatGPT 分別獨立撰寫
風格歸納：由 Claude Code 子代理獨立執行
報告撰寫：由 Claude Code 執行

本研究之循環性（以 AI 工具研究 AI 寫作）為自覺之方法論選擇，其限制於結論章已作說明。

一、研究動機

過去兩年之間，公開發表的文字中有可觀的比例來自大型語言模型。部落格、電子報、自媒體、內容農場、甚至部分雜誌與報導平台，都能見到 AI 代筆或 AI 輔助的痕跡。與此同時，長期以文字為業的創作者、編輯、教師與評論者，紛紛在社群上交換判讀心得：有人從用詞下手，說 AI 偏愛「重新定義」、「真正的」、「某種程度上」；有人從句型下手，說 AI 總愛寫「不是 X，而是 Y」；有人從結構下手，說 AI 寫什麼題目最後都會收到「我們」與「未來」。這些觀察多半是直覺式的、個案式的，缺乏對照與量化。

於是一個實證層面的問題自然浮現：AI 文究竟是不是真的存在可辨識的特徵？所謂的「AI 味」是讀者的先入之見，還是文本裡客觀可數的語言行為？更進一步的問題是：如果特徵真的存在，它是某一家公司某一個模型的個別習癖，還是跨模型、跨訓練資料、跨公司的共通語言指紋？

本研究嘗試以實驗與統計歸納的方式回應這組問題。研究設計的核心想法是：把兩個由不同公司、以不同資料、以不同方法獨立訓練出來的大型語言模型，放進同一場寫作任務裡，觀察它們的作品在完全盲評的情況下，會不會被獨立的讀者歸納出相同的可辨識特徵。如果兩位獨立讀者、在不知道對方存在、也不知道文章來自 AI 的情況下，對各自讀到的二十篇文章歸納出高度重疊的風格清單，那麼所謂的「AI 文共通指紋」便不是憑感覺的印象，而是一組可以被重現、被驗證的語言行為。

二、研究方法

為避免任何跨階段的訊息汙染，研究分成四個階段，每個階段都使用獨立的會話脈絡，前一階段的結果不進入後一階段的系統提示裡。

第一階段是題目生成。請甲作者獨立產生二十個雜誌專題題目，分佈於科技、環境、社會、文化、財經、健康、教育、藝術、運動、心理、建築、飲食、旅遊、政治等領域，以確保主題的多樣性，避免某一特定題材把文章全部拖進固定模板。

第二階段是平行寫作。以新的會話，分別讓甲作者與乙作者針對這同一組二十個題目各自撰寫一篇雜誌風格文章，每位作者各完成二十篇，共計四十篇。每一篇都由獨立的子代理負責，子代理之間沒有任何共享脈絡，不能互相參考、互相修改、互相知曉對方的存在。給子代理的提示只有一句：「以雜誌風格撰寫，正體中文，字數不限」。沒有範本、沒有結構指示、沒有字數上下限、沒有風格偏好。這個設計刻意讓模型「自由發揮」，讓它們依照內在的寫作傾向自然成形。

第三階段是獨立歸納。再以全新的子代理，分別閱讀甲作者的二十篇與乙作者的二十篇，在完全不知道對方存在、也不知道文章來自 AI的情況下，獨立歸納每位作者的可辨識寫作風格。兩份分析完全獨立生成，彼此盲評。

第四階段是比對分析。把兩份獨立產生的風格清單放在一起交叉比對，尋找兩邊都獨立命中的特徵，同時也標記兩邊分歧的部分。對某些被兩邊同時點名的句型，再以 grep 量化查證。例如「不是 X，而是Y」這個句式，在甲作者二十篇中出現 67 次，篇均 3.35；在乙作者二十篇中出現 127 次，篇均 6.35。

三、兩位作者的共通可辨識特徵

兩份獨立分析清單的重疊度，遠遠超出隨機巧合可以解釋的範圍。以下歸納六組共通特徵。這六組特徵中的每一組，都被兩份分析在不知對方存在的前提下，各自獨立列舉出來。

（一）「不是 X，而是 Y」的推翻式對位句

兩份分析都把這個句型列為最顯著的標誌之一。甲作者的分析把它列入「句法特色與用詞偏好」第一條，舉例包含「這不是『更快』，這是『更根本地不同』」、「它不是在哀悼，她是在拒絕哀悼」等。乙作者的分析更進一步，把它定位為「作者推進論述的核心修辭裝置」，並指出其衍生變體「不只 X，也 Y」、「與其說是 X，不如說是Y」。

量化數據支持這項判斷：甲作者二十篇共 67 次、篇均 3.35，乙作者二十篇共 127 次、篇均 6.35。兩位作者的使用密度雖有差距，但沒有一位低於每篇平均三次。這個句型的功能高度一致：先引述一個常識、再推翻、再提出新定義，是一個「翻案 → 正名」的兩拍動作。不論是甲作者的抒情篇章，或乙作者的論述篇章，都把它當成結構性的修辭骨架。

（二）「具體場景 → 抽象議題」的電影式開場

兩份分析在談到開頭時，都不約而同用到「場景化」、「鏡頭感」、「具體」這組描述。甲作者的分析列出「凌晨兩點十七分、台北市信義區一間小套房的窗邊」、「凌晨三點十七分、新北市某家中型長照機構的走廊深處」等實例，並特別指出「凌晨」、「深夜」、精確到分鐘的時間戳反覆出現。乙作者的分析則舉出「深夜兩點」、「凌晨三點」，並明確指出「電影式的鏡頭感：常先描寫光線、聲音、氣味、手的動作」。

兩邊都獨立觀察到：兩位作者幾乎不會以概念、定義或統計數字開場；而是先用一個具體的場景把讀者「放進」現場，再把鏡頭拉遠、把議題抬高。甲作者的場景更偏向有具體人名的側寫；乙作者的場景更偏向無主體的感官畫面。但兩者的功能完全一致——先具象、再抽象。

（三）第二段必備的「震盪轉折句」

甲作者的分析稱之為「震盪句」：場景鋪陳完後，常用一句獨立成段的短句，把讀者從場景拉回議題，作為轉場樞紐，並舉出「這不是個案，而是……」、「這不是科幻小說，也不是……」等句式。乙作者的分析則稱之為「轉折句」：第一段末尾或第二段開頭幾乎必出現，以「但」、「然而」、「問題是」、「真正令人不安的是」、「真正改變的是」把場景拉向核心問題意識。

命名不同，觀察完全一致。這是一個兩作者都保留的結構性動作：場景之後，一定有一記鐘聲，把讀者從感官領域拉回論述領域。

（四）三項排比與三段式編號

三個平行短句或三個平行短語連排，兩份分析都視為標誌性句法。甲作者的分析列舉「一組三項的排比、或連續三問」，舉出「一種治癒……一個國家……一個平凡人……」。乙作者的分析則直接以「三段式排比極為頻繁」一句來歸納，舉出「它便宜、輕巧、耐用」、「低薪、長工時、低喘息」、「更快、更小、更便宜」等。

三項排比之外，兩邊也都獨立注意到「編號式」的結構推進。甲作者的分析提到「標號條列與粗體短語」、「第一／第二／第三／第四」；乙作者的分析則提到「第一個兩難、第二個兩難、第三個兩難」，並指出編號通常以意象或概念命名，而非乾硬的「第一點」。兩邊都看到這是一個偏好用「三」或「四」把複雜議題切成平行小節的思考慣性。

（五）「陰影／代價／兩難」的平衡章節

兩份分析都指出，兩位作者在讚譽一項新趨勢時，幾乎必然配一個對應的反面章節。甲作者的分析把它列為「隱憂／陰影／矛盾」章節必備，並指出常見命名如「陰影與反思」、「看不見的代價」、「矛盾與陰影」、「邊界的崩塌」。乙作者的分析則說「幾乎每篇文章都會出現一段『代價／矛盾／兩難』的討論，將技術或趨勢的陰影面攤開，保持議題的兩面性」。

這個特徵的重要性在於：它不是單篇偶發的修辭選擇，而是一個跨篇章、跨題材的結構性動作。甲乙兩位作者在二十個不同主題上都重覆這個動作，顯示這是模型內在的論述倫理——任何新事物都不能單面讚頌，必須附上對應的陰影。

（六）「我們／未來／人」的哲學化收束

兩份分析在描述結尾時，用字幾乎可以互換。甲作者的分析稱之為「人性化收束 + 哲思提問」，指結尾幾乎都包含兩個動作：先回扣開頭場景或人物，再以一個開放式設問收束。乙作者的分析稱之為「哲學化、抒情化的收束」，指結尾幾乎不下結論、不給建議，而是「畫面回扣 + 一句提煉 + 一句開放式提醒」。

兩邊也都獨立注意到，這個收束動作的終點指向同一組抽象名詞：文明、人類、社會、共同體、我們。甲作者的分析指出「『我們』是最常用的主語」、結尾常以「我們才剛剛上路」、「我們正站在這個黎明裡」收束。乙作者的分析則指出「結尾常升至『文明』、『人類』、『社會』、『我們』的高度」、「不論主題為何，結尾都會回到『人』」。

兩位作者不管題目是量子電腦、是海洋塑膠、是電競、是長照，結局總是回到同一個集體主語、同一個未來時態、同一個開放式提問。這是全篇最大的結構性巧合，也是最清楚的共通指紋。

（七）其他並列出現的次級共通特徵

除上述六組主幹之外，兩份分析還有若干中層特徵重疊：

一是「重新 X」的慣用搭配。甲作者的分析在「高頻動詞與譬喻」中列出「改寫餐盤、改寫規則、改寫命運、改寫生命密碼、改寫歷史」。乙作者的分析則獨立列出「重新定義、重新思考、重新理解、重新配置、重新安排、重新畫線」，並直指「重新 + 動詞」是明顯的慣用搭配。兩邊一個聚焦「改寫」、一個聚焦「重新」，詞彙相近、功能完全一致。

二是「一 + 量詞 + 名詞」的小型意象起手。甲作者的分析舉出「一杯水」、「一把泥土」、「一張千元鈔」、「一塊不曾奔跑過的牛排」。乙作者的分析舉出「一盞小燈」、「一扇門」、「一道光」、「一場雨」、「一座橋」、「一把鑰匙」。兩邊都獨立把這個句式列為指紋。

三是反問與設問的高密度使用，特別是章節首尾。兩邊都獨立舉出具體例證。

四是句首連接詞的推進節奏。兩邊都獨立注意到「然而／但／因此／於是／事實上／更重要的是」這組轉折詞出現密度極高。

五是「從 A 到 B」、「從 A 走向 B」的轉向敘述。兩邊都獨立舉出實例。

六是對「速度／慢」、「效率／韌性」、「全球／在地」、「光／黑暗」這類二元對比意象的偏好。兩邊都獨立列出。

四、兩位作者的明顯差異

在共通骨架之外，兩位作者也存在不可忽視的差異。把差異列出，有助於釐清哪一些特徵屬於「共通 AI 語言指紋」，哪一些只是單一模型的個別習癖。

第一個差異是格式化的外顯程度。甲作者熱中於格式層的裝飾：章節分隔符號「＊＊＊」或「───」、西方人名用全形點「‧」、年份一律用中文數字「二○二四年」、外來語必附英文原文與縮寫、文末標記「（全文完）」。乙作者幾乎沒有這些格式層動作：沒有裝飾分隔符、不用全形點、年份採阿拉伯數字、不寫文末標記。甲作者更像「在模擬雜誌的排版」，乙作者則更像「在模擬雜誌的散文」。

第二個差異是資料顆粒度。甲作者在二十篇中大量使用具名人物（含化名）與機構頭銜：三十四歲的平面設計師林庭宇、輔仁大學社會系副教授陳可欣、中研院資訊科學研究所的李博士。機構名稱齊全，常夾雜「不願具名」的修飾。乙作者則明顯走「敘述論述」而非「資料新聞」：資料引用極少出現具體數字、人名、機構名，時間尺度偏好「某一天」、「未來某一天」、「過去三十年」、「半個世紀」等模糊形式。

第三個差異是比喻的方向。甲作者的比喻偏向身體與氣象——血液、胎盤、指紋、黎明、浪潮、曙光；乙作者的比喻偏向系統與工程——倉庫、介面、工具箱、語法、基礎設施、閘門。甲作者抒情，乙作者機制化。

第四個差異是「不是 X，而是 Y」句型的使用密度。乙作者每篇平均6.35 次，約為甲作者 3.35 次的兩倍。乙作者把這個句型當成主骨架，甲作者把它當成重音之一。

這些差異顯示兩個模型在語感層確實有各自的調性；但它們都沒有推翻共通的那一組骨架——場景化開場、震盪轉折句、三項排比、平衡陰影章、「我們／未來／人」收束、「不是 X，而是 Y」的對位句，仍然在兩位作者身上同時出現。

五、量化驗證片段

本研究並非全面的語料庫統計，但在若干關鍵句型上做了量化抽查，以確認獨立分析中對密度的描述並非印象派。

以「不是 X，而是 Y」為例，實際 grep 計數如前文所述：甲作者67 / 20 篇、篇均 3.35；乙作者 127 / 20 篇、篇均 6.35。兩位作者都沒有一篇該句型完全不用。

這組數字的意義不在於比較誰多誰少，而在於確認這個句型是一個可重現的行為，而不是讀者事後選擇性記憶下的印象。讀者可能因為討厭 AI 文而產生「又是不是 X 而是 Y」的主觀反應，但 grep 的數字是客觀的：即便最節制的那一位作者，二十篇裡也用了 67 次。六、研究結論

回到研究動機的原始問題：AI 文是否存在可辨識的特徵？本研究的回答是：存在，而且是跨模型共通的。

在兩位作者完全不共享脈絡、兩位分析者也完全不共享脈絡的四重盲評設計下，獨立歸納出的風格清單在以下六個面向高度重疊：對位句的推翻式修辭、具體場景的電影式開場、第二段的震盪轉折句、三項排比與編號式推進、陰影章節的結構性平衡、以「我們／未來／人」收束的哲學化結尾。這六個面向再加上若干中層特徵——「重新／改寫」的動詞搭配、「一 + 量詞」的小型意象、高密度反問、轉折副詞的推進節奏、「從 A 到 B」的轉向敘述、二元對比意象——共同構成一組可觀察、可重現、可量化的寫作指紋。

這套指紋的共通性，不能用「同一家公司的同一個模型」來解釋，因為兩位作者分別來自不同的公司、不同的訓練管線；也不能用「同一篇提示」來解釋，因為寫作提示只給「以雜誌風格撰寫，正體中文，字數不限」這一句話，沒有任何結構或風格暗示；更不能用「同一個人類評分者的先入之見」來解釋，因為兩份風格分析是獨立的子代理在盲評情境下各自寫成的。

在這些控制條件下仍然收斂到同一組特徵，一個合理的解釋是：這組特徵來自大型語言模型在雜誌文體下的共同行為模式。它可能源自相近的訓練資料分布，可能源自相近的人類回饋偏好，也可能源自「雜誌風格」這個提示詞本身在當代語料中被共同聯繫到的一組寫作範本。這三種來源哪一種主導，超出本研究可驗證的範圍。但無論主導因素為何，觀察事實是清楚的：來自不同公司、獨立訓練、獨立寫作的大型語言模型，在雜誌文體下呈現的寫作指紋高度重疊，足以構成一套可辨識的共通特徵。

這份報告的目的只到「驗證」為止。它不嘗試為任何一方提供應對建議，也不把這些指紋視為缺陷或優點。它只是把讀者社群長期以來憑直覺辨認的「AI 味」，以實驗與盲評方法描出輪廓、以 grep 數字驗證密度，讓這件一直在被討論、但缺乏對照的事，第一次以可重現的形式被寫下來。

（全文完）

附件：研究文本資料。