openfree commited on
Commit
f33fd3c
·
verified ·
1 Parent(s): c3e32bb

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +15 -45
README.md CHANGED
@@ -10,62 +10,32 @@ pinned: false
10
  license: apache-2.0
11
  short_description: One embed. Four invisible layers. 34 attacks defeated.
12
  ---
 
13
 
14
- 복사해도, AI가 재작성해도, 30가지 공격을 해도 흔적이 남는 워터마크를 만들었습니다
15
 
 
16
 
17
- I. 챗GPT가 글로 학습했다 근데 증명을 못 한다
18
 
19
- a. 내가 블로그에 글, 챗GPT한테 물어보면 비슷한 답이 나옵니다. 내가 찍은 사진과 놀라울 정도로 닮은 이미지가 AI로 생성됩니다. 내 영상의 구성을 그대로 베낀 콘텐츠가 돌아다닙니다. "어? 이거 내 거 아닌가?" 느낌은 확실한데, 증명할 방법이 없습니다.
20
 
21
- b. OpenAI, Google, Meta 없이 수십억 건의 콘텐츠를 긁어서 학습시켰다는 이제 공공연한 사실입니다. 문제는 "내 콘텐츠가 거기 포함됐다"는 기술적으로 입증하는 사실상 불가능하다는 겁니다. robots.txt요? 무시하는 크롤러가 태반입니다. 이용약관에 "AI 학습 금지"를 써놔도 이미 학습된 건 되돌릴 수 없어요.
22
 
23
- c. 결국 "내 거라는 증거"가 없으면 아무 일도 일어나지 않습니다.
24
 
 
25
 
26
- II. AI가 도둑의 최고 도구가 세상
27
 
28
- a. AI 무단학습만이 문제가 아닙니다. 사람이 직접 훔치는 것도 AI 때문에 훨씬 쉬워졌어요. 예전엔 복붙하면 최소한 똑같은 문장이 남았습니다. 지금은 "이거 다시 써줘" 한마디면 3초 만에 원문의 흔적이 사라집니다. 요약해줘, 문체 바꿔줘, 번역했다 다시 돌려줘 — 한 바퀴 돌면 겹치는 문장이 하나도 없는데, 아이디어는 통째로 내 겁니다.
29
 
30
- b. 이미지는 리사이즈 번이면 해시값이 바뀌고, 영상은 캡처해서 재업로드하면 추적이 끊깁니다. 만드는 사람은 며칠을 쏟고, 가져가는 사람은 3초. 그리고 증거는 없음. 이게 2025년 콘텐츠 창작자의 현실입니다.
31
 
32
- c. 기존 워터마크요? 대부분 한 가지 트릭에 의존합니다. 챗GPT한테 통과시키면 자연스럽게 날아가고, 정규화 한 번이면 증발해요. 게다가 워터마크를 미리 안 심어둔 콘텐츠는 보호 자체가 불가능합니다. 이미 퍼진 다음에 발견하면? 할 수 있는 게 없죠.
33
 
 
34
 
35
- III. 그래서 만들었습니다 챗GPT를 통과해도 남는 워터마크
36
 
37
- a. StealthMark는 가지를 합니다.
38
-
39
- b. 하나, 텍스트·이미지·영상에 눈에 안 보이는 워터마크를 여러 겹으로 심습니다. "여러 겹"이 핵심인데, 서로 완전히 다른 원리로 동작하기 때문에 한 겹을 지워도 다른 겹이 살아남습니다. 챗GPT한테 요약시켜도, 패러프레이징해도, 문체를 바꿔도, 정규화를 해도 어딘가에 흔적이 남아 있어요. "이건 원래 내 콘텐츠"라는 기술적 증거를 심어두는 겁니다.
40
-
41
- c. 둘, 워터마크를 못 심은 콘텐츠도 잡습니다. 원본만 있으면 됩니다. 의심되는 콘텐츠와 비교해서 얼마나 베꼈는지, 어떤 방식으로 도용했는지를 7가지 방법으로 분석해줍니다. 이미지와 영상도 마찬가지예요.
42
-
43
- d. 심어뒀으면 증거를 들이밀고. 못 심었어도 원본 대조로 잡아낸다. 사전이든 사후든 빈틈 없이.
44
-
45
-
46
- IV. 진짜 챗GPT한테 넣어봤습니다 — 30가지 공격 + 9개 AI 모델 테스트
47
-
48
- a. "AI 통과해도 남는다"는 말, 입으로만 하면 의미 없죠. StealthMark 안에 30종 공격 시뮬레이션이 들어있습니다. 워터마크를 심고, 그 자리에서 바로 부숴보는 겁니다. 정규화, 포맷 제거, 문자 조작, 구두점 변경, AI 패러프레이징, 요약, 역번역, 문장 셔플, 짜깁기까지 실전에서 벌어지는 공격 총집합입니다.
49
-
50
- b. 더 재밌는 건, 워터마크가 완전히 사라져도 게임 오버가 아니라는 점입니다. 원문과의 구조적 유사 흔적을 따로 추적하기 때문에 "워터마크는 깼는데 도용 흔적은 못 지웠네?"라는 판정이 나옵니다.
51
-
52
- c. 그리고 GPT-OSS, Qwen, LLaMA, Kimi 등 9개 AI 모델에 워터마크 텍스트를 직접 먹여서 생존 여부를 실시간 확인하는 LLM 통과 테스트도 있습니다. AI로 지우려는 쪽 vs AI를 거쳐도 남기려는 쪽. 어느 쪽이 이기는지 직접 확인해보세요.
53
-
54
-
55
- V. 글, 사진, 영상 — 내가 만든 건 다 지킨다
56
-
57
- a. 블로거, 사진작가, 유튜버, 기업 마케터. 만드는 방식은 다 다른데, 도용당하면 느끼는 감정은 똑같습니다. StealthMark는 텍스트, 이미지, 영상 세 가지를 한 곳에서 보호합니다. 워터마크 삽입, 추출, 원본 대조를 미디어별로 지원하고, 텍스트는 30종 공격 + LLM 테스트 + 7가지 표절 탐지까지 풀세트입니다.
58
-
59
-
60
- VI. 지금 바로, 무료로
61
-
62
- a. Hugging Face Spaces에 공개되어 있습니다. 설치도 가입도 필요 없어요.
63
-
64
- b. 내 글 하나 넣어보세요. 워터마크를 심고, 30가지 공격을 돌리고, AI 모델에 통과시켜보세요. "이게 진짜 남아있네?" 하는 순간이 올 겁니다.
65
-
66
- c. 챗GPT가 내 콘텐츠를 학습해도, 누군가 내 글을 AI로 바꿔 써도, 증거는 남깁니다.
67
-
68
-
69
- https://huggingface.co/spaces/VIDraft/StealthMark
70
-
71
- 피드백 환영합니다.
 
10
  license: apache-2.0
11
  short_description: One embed. Four invisible layers. 34 attacks defeated.
12
  ---
13
+ # AI Is Training on Your Content Without Permission — Fight Back with Invisible Watermarks
14
 
15
+ ## The Problem: No Way to Prove It
16
 
17
+ Most training data for generative AI models is crawled from the web without consent. Your writing gets summarized, your photos get reprocessed, your videos get clipped — and you have almost no way to prove you are the original creator. Existing watermarks are either visible to the naked eye or wiped out by a single pass through AI preprocessing pipelines (Unicode normalization, tokenization, text cleaning).
18
 
19
+ ## The Solution: Detect Before Embedding, Track After
20
 
21
+ StealthMark protects content in two stages.
22
 
23
+ **Pre-embed** Detect theft even without a watermark. Text plagiarism detection, multi-algorithm image similarity analysis (perceptual hash, SSIM, color histogram, feature matching), and video temporal matching identify copies, edits, and partial excerpts.
24
 
25
+ **Post-embed** — Embed multi-layer invisible watermarks that are completely undetectable to the human eye. If one layer is destroyed, the others survive independently. Even if all layers are removed, the forensic traces of the removal attempt itself remain as evidence.
26
 
27
+ ## Text: 4 Independent Watermark Layers
28
 
29
+ Four different mechanisms operate simultaneously. Zero-width Unicode characters inserted at Korean morpheme / English word boundaries. Style fingerprinting through deterministic synonym, ending, and connective substitution patterns. SHA-256 timestamped evidence packages for legal disputes. And micro-marks anchored to punctuation using a separate Unicode category. Because each layer targets a different Unicode category, an attack aimed at one cannot eliminate the others. Full bilingual Korean/English support with zero impact on readability or content quality.
30
 
31
+ ## 34-Attack Defense: Dual-Axis Verdict
32
 
33
+ Seven categories, 34 attack types simulated end-to-end: Unicode normalization, invisible character removal, homoglyph substitution (9,619 confusables DB), and AI meaning-preserving rewriting (paraphrase, summary, back-translation, style shift). Each attack is scored on two axes Signal (did the watermark survive?) and Trace (are forensic traces of the attack detectable?) so even when a watermark is fully destroyed, the deliberate removal attempt can still be proven.
34
 
35
+ ## Image and Video
36
 
37
+ Images receive DCT frequency-domain invisible watermarks that survive JPEG compression and resizing. Videos are protected by embedding watermarks into keyframes and propagating them temporally across all frames, with majority-vote extraction for reliable recovery even after frame loss. Both media types also support pre-embed similarity analysis for detecting existing theft.
38
 
39
+ ## Who Is This For
40
 
41
+ Individual creators, rights holders who need legal evidence against unauthorized AI training, media companies securing proof of origin before distribution, and organizations tracking internal document leaks. Full Korean/English bilingual support, open source, built with Gradio.