Mastiporuto Senia

2026

Bitcoin Fraud Detection 論文閱讀分析:很多團隊真正該怕的,不是圖不夠大,而是交易圖本身早就不再值得信任

這篇論文真正有價值的地方,不是在 Bitcoin fraud detection 上再提一個新模型,而是把大家默認「交易是圖,所以 GNN 應該更強」這個前提整個拆開重驗。作者在更嚴格的 temporal-shift 與 leakage-free 設定下發現,raw-feature Random Forest 可達 F1 0.821,明顯高於最強的 GraphSAGE 0.689 ± 0.017,甚至連隨機打亂的邊都比真實交易圖高出 8.9 個 F1 點。這篇真正提醒的是:在風險偵測裡,圖結構不一定是資產,它也可能是把模型帶偏的 liability。

2026 年 4 月 22 日

DEJA 論文閱讀分析:很多 RAG 真正危險的,不是突然拒答,而是開始穩定地講一堆沒用的正確廢話

DEJA 真正指出的,不只是 RAG 會不會被打到拒答,而是它可能在 retrieval 依舊成功、回答依舊流暢的情況下,穩定退化成低資訊量、低可用性的 soft failure。論文在 NQ、HotpotQA、FiQA 上讓惡意文件 retrieval success rate 超過 94%,SASR 最高達 92.27%,而 query paraphrasing、perplexity filtering 與擴大 context size 都難以有效緩解。

2026 年 4 月 22 日

Dual-Guard 論文閱讀分析:很多 AIGC 治理真正缺的,不是再多一個 watermark,而是知道它哪裡被改過

這篇論文真正有價值的地方,不是再證明一次 watermark 可以驗出 AI 圖,而是把 provenance 驗證、抗 reprompt / diffusion editing 與區域級 tamper localization 接成同一套內容完整性管線。作者在 4,000 張 provenance suite 上做到 AUC 1.000,在 2,400-sample benchmark 上對 reprompt 與 DiffEdit 都達到 1.000 auth reject,對 local tamper 達到 0.999,同時 clean false rejection 和 false alarm 只有 0.003 與 0.001。

2026 年 4 月 22 日

Offensive Security Agent 架構論文閱讀分析:很多系統真正缺的,不是再多幾個分身,而是先知道什麼時候單兵就夠

這篇論文真正有價值的地方,不是再證明 multi-agent 可以做 offensive security,而是把 agent 拓樸選型做成可比較的 benchmark:在 600 runs 裡,MAS-Indep 以 64.2% validated detection 拿下 coverage 端最佳表現,但 SAS 以 53 秒 median TTFV 與每個 validated finding 僅 0.058 美元成為效率錨點,說明多代理不是越複雜越好,真正該優化的是 observability、domain difficulty 與 coordination overhead 之間的折衝。

2026 年 4 月 22 日

ProjLens 論文閱讀分析:很多多模態模型真正危險的,不是主模型突然學壞,而是那層 projector 早就把視覺訊號悄悄翻成危險行為

這篇論文最有價值的地方,不只是證明多模態 backdoor 可以打得很成功,而是把問題往前推到 mechanistic level:作者發現就算只 fine-tune projector,也足以把拒答、惡意注入、感知劫持與越獄行為種進 MLLM,真正的關鍵不是顯眼的 trigger neuron,而是 projector 低秩子空間裡的 backdoor 參數與一條把表示往危險語意推的 universal drift vector。

2026 年 4 月 22 日