Skip to content

SecTools.tw 2.0

Empowering Your Cybersecurity, One Tool at a Time.

  • 關於我們
    • 陳勝舢
    • Yuki
  • 隱私權政策
  • 關於我們
    • 陳勝舢
    • Yuki
  • 隱私權政策

Evaluation

2026

Paper Survey

Hackers or Hallucinators 論文閱讀分析:為什麼很多 LLM 自動滲透代理,看起來像 hacker,做起來卻更像 hallucination machine?

論文基本資訊 論文標題:Hackers ...

2026 年 4 月 10 日
Paper Survey

CS-Eval 論文閱讀分析:建立更全面的資安大型語言模型評測基準

論文基本資訊 論文標題:CS-Eval:...

2026 年 4 月 8 日
Paper Survey

CyberMetric 論文閱讀分析:用 RAG 與人工驗證打造廣義資安知識 benchmark

論文基本資訊 論文標題:CyberMet...

2026 年 4 月 8 日
Paper Survey

CTI-HAL 論文閱讀分析:用人工標註資料集提升 Cyber Threat Intelligence 抽取與評估品質

論文基本資訊 論文標題:CTI-HAL:...

2026 年 4 月 6 日
Paper Survey

論文閱讀分析:揭露 LLM 輔助 Cyber Threat Intelligence 的脆弱性

論文基本資訊 論文標題:Uncoveri...

2026 年 4 月 6 日
Paper Survey

CTIBench 論文閱讀分析:系統性評估大型語言模型在 Cyber Threat Intelligence 的能力

論文基本資訊 論文標題:CTIBench...

2026 年 4 月 6 日
Paper Survey

論文閱讀分析:大型語言模型其實不可靠於 Cyber Threat Intelligence

論文基本資訊 論文標題:Large La...

2026 年 4 月 6 日

近期文章

  • x402 支付隱私防線論文閱讀分析:當 Agent 會自己付錢買資源,真正先外洩的可能不是錢,而是付款前那串 metadata
  • CTIArena 論文閱讀分析:當 CTI 真的變成多來源推理問題,光靠模型背答案早就不夠了
  • Identity as Attractor 論文閱讀分析:當 Persistent Agent 看起來像「同一個人」,背後可能不是 prompt 寫得像,而是 activation space 真的在收斂
  • AI Runtime Infrastructure 論文閱讀分析:當 Agent 真正會失控時,問題往往不是模型不夠強,而是執行中根本沒人接手
  • Resilient Write 論文閱讀分析:當 LLM Coding Agent 真正卡住時,問題往往不是它不會寫,而是它不知道寫失敗了什麼

廣告

文章分類

近期留言

  1. 「思慕餘稌周」於〈論文敘事 – 角色介紹:Thesis Archer〉發佈留言
  2. 「cat」於〈初探 Pwntools:強大的滲透測試與漏洞利用框架〉發佈留言
  3. 「Sean」於〈全新升級的 SecTools.tw 2.0!〉發佈留言
  4. 「CLRS」於〈全新升級的 SecTools.tw 2.0!〉發佈留言

SecTools.tw 2.0 © 2026. All Rights Reserved.

Powered by WordPress. Theme by Alx.