AnomalyShield — Forskningshubb för barnsäkerhet och anomalidetektion

Om AnomalyShield

Vad är AnomalyShield?

AnomalyShield är ett referensramverk och forskningsprojekt för ett triage-system som rangordnar konton och beteenden online efter uppskattad risk för anomalier och hot. Systemet kombinerar innehålls- och nätverksbaserade signaler till en kalibrerad poäng (0–100) för prioritering.

Grundprincip: Poäng ändrar bara ordningen i den mänskliga granskningskön. Människor fattar alla beslut. Bekräftade fall eskaleras uteslutande via lagliga kanaler. Ingen namnpublicering, inga automatiska åtgärder.

Materialet finns på flera språk med rapporter på engelska och svenska. Allt innehåll är illustrativt tills verkliga utvärderingsdata med bekräftade utfall finns tillgängliga.

Forskning & rapporter

Ladda ner rapporterna

Vill du ha allt? Ladda ner hela paketet (alla rapporter) som ett ZIP-arkiv.

Ladda ner allt (ZIP)

Teknisk · 25 sidor

Metodik & konfidensutvärdering

Fullständig metodik för poängsättning och en efterlevnadsanalys av hur mycket förtroende som kan sättas till de högst rankade resultaten — kalibrering, precision@k, rättvisa och styrning. För tillsynsmyndigheter.

Ladda ner PDF

Klarspråk · 5 sidor

Förklaring för 10 000 användare

Vad en utvärdering av 10 000 användare skulle visa och hur säkra vi är på de tio högst rankade — med enkel konfusionsmatris och tydliga grafer.

Ladda ner PDF

Uppskattning · 6 sidor

Sverige / Facebook-uppskattning

Hur många Facebook-konton i Sverige skulle flaggas vid olika inställningar, och hur många är troligen verkliga — baserat på befolkningsdata och illustrativa detektionsgrader.

Ladda ner PDF

Referens

Prevalensrapport — Sverige

Hur många i Sverige har sexuellt intresse för barn, vägen från attraktion till brott, och varför modellen använder en basfrekvens — inte etnicitet. Välj språk nedan.

Välj språk

Prevalence brief — välj språk

English

Svenska

Suomi

Deutsch

Agentforskning – tio specialiserade analyser (2026)

Nedladdningsbara fulltexter finns i research-outputs-mappen. Här är sammanfattningar och nyckelfynd från de tio agenterna som genomfördes enligt projektets ursprungliga specifikation.

1. Sociala plattformar i Sverige

Översikt över plattformar där svenska minderåriga och vuxna interagerar. Fokus på kontaktmöjligheter, kryptering och rapporteringsvägar.

Full text (MD)

2. Proaktiva signaler (DAC)

Detaljerad genomgång av innehållsbaserade grooming-signaler, eskalering och asymmetri utan att publicera blockeringslistor.

Full text (MD)

3. Reaktiva & nätverkssignaler

Minor-fanout, burst-aktivitet, off-platform-försök och låg-vikt närhet till tidigare åtgärdade aktörer.

Full text (MD)

4. Offentliga algoritmer

Klar, publik förklaring + pseudokod för DAC, Social och fusion enligt Methodology Appendix B.

Full text (MD)

5. Prevalens & basfrekvenser

Uppdaterad/utökad analys baserat på befintliga rapporter – attraktion, brott och aktiv online-predation.

Full text (MD)

6. Operativa protokoll & visselblåsning

Praktisk vägledning för operativa rutiner, SOP:er, utbildning och eskaleringsrutiner i Sverige.

Full text (MD)

7. Juridik & regelverk (Sverige/EU 2026)

GDPR, DSA, ePrivacy, EU AI Act, krav på DPIA, meningsfull mänsklig granskning och dokumentation.

Full text (MD)

8. Syntetiska exempel

6–8 helt påhittade scenarier (låg/medel/hög risk) med signaler, poängband och rekommenderad granskaråtgärd. Tydligt märkta som syntetiska.

Full text (MD)

9. Vanliga frågor (utökad)

20+ AEO-optimerade frågor och svar för den centrala webbplatsen, konsekventa med styrprinciperna.

Full text (MD)

10. AEO & synlighet

Hur en transparent, källhänvisad forskningswebbplats blir citerbar för både traditionell sök och AI-svarmotorer.

Full text (MD)

Metod & offentliga algoritmer

AnomalyShield-poängsättning – transparent och granskningsbar

Systemet använder två delpoäng som fusioneras och kalibreras. Allt är utformat så att en oberoende granskare kan förstå och ifrågasätta resultatet. Nedan följer den offentliga referensspecifikationen (pseudokod från Methodology & Confidence Report, Appendix B, samt agentanalys).

DAC-subscore (Deviant-Age-Contact)

def dac_subscore(age_gap_z, grooming_p, escalation, asymmetry):
    z = 0.9*age_gap_z + 1.6*grooming_p + 1.2*escalation + 0.7*asymmetry - 3.1
    return 100 * sigmoid(temperature_scale(z))

Social-Contact-subscore

def social_subscore(minor_fanout, init_asym, burst, offplatform, proximity_adv):
    z = 1.4*minor_fanout + 0.8*init_asym + 0.6*burst + 0.9*offplatform + 0.2*proximity_adv - 2.7
    return 100 * sigmoid(z)

Composite (fusion + kalibrering)

def composite(s_dac, s_social):
    z = 1.2*logit(s_dac/100) + 0.8*logit(s_social/100) + 0.3*interaction(s_dac, s_social) + b0
    P = 100 * sigmoid(recalibrate(z))   # temperature or isotonic on held-out set
    return P, credible_interval(z)

Full kontext, vikter (illustrativa), kalibrering, osäkerhetsband och undergruppsgranskning finns i Methodology & Confidence Report och agent 4:s utdata.

Öppen kod & referensimplementation

Körbar referensmodell – öppen grund för fortsatt arbete

En öppen, körbar referensimplementation av AnomalyShield-metoden i Python. Den är framtagen för att myndigheter, forskare och ideella organisationer ska kunna läsa, köra, granska och bygga vidare på metoden – och för utvärdering av samarbetspartner. Ingen träningsdata, inga riktiga personuppgifter. Vikterna är illustrativa platshållare; en poäng är en risksignal för mänsklig granskning, aldrig ett skuldfastställande.

Vad som ingår: poängfunktioner (DAC + Social-Contact + fusion), kalibrering (temperature scaling, ECE, Brier), utvärdering för obalanserade data (precision@k, recall, lift, AUPRC/AUROC, bootstrap-konfidensintervall), syntetisk datagenerator, enhetstester samt modellkort, styrning och policy för acceptabel användning. Vad som inte ingår: tränad modell, extraktion av signaler från riktigt innehåll, eller någon möjlighet att peka ut verkliga personer.

Ladda ner koden (Python, ~0,1 MB) – Apache-2.0 med tillägg för acceptabel användning.

Ladda ner referensimplementation (ZIP)

Demoresultat (syntetiskt, illustrativt)

Utdata från python examples/run_demo.py på en syntetisk population (120 000 entiteter, basfrekvens ~0,15 %). Diagrammen visar exakt det som metodrapporten beskriver – men nu som körbar kod: precisionen i toppen av kön med konfidensintervall, och kalibreringen efter temperature scaling.

Precision@k med 95% konfidensintervall (syntetiskt)

Kalibrering / reliability efter temperature scaling (syntetiskt)

Innan någon verklig pilot krävs: märkt data, träning, kalibrering på uthållet data, rättvisegranskning, DPIA och rättslig grund (GDPR art. 8 och 22, DSA, EU:s AI-förordning) samt mänsklig granskning och lagliga eskaleringsvägar. Se MODEL CARD, GOVERNANCE och ACCEPTABLE USE.

Syntetiska exempel

Illustrativa scenarier (helt påhittade)

Exemplen är 100 % syntetiska och tydligt märkta. De visar hur olika risknivåer kan yttra sig och vilken åtgärd en mänsklig granskare bör ta. Används endast för utbildning och transparens.

Exempel 1 — Låg risk (proaktiv)

Vuxen: “Hej, jag såg ditt inlägg om det nya spelet. Hur gammal är du?”
Underårig: “13”
Vuxen: “Coolt, min systerdotter är också intresserad av det spelet.”
Signaler: Enstaka åldersfråga + omedelbar icke-sexuell familjereferens. Inga sekretessbegäran.
Poängband (illustrativt): Låg (0–25). Rutinmässig stickprovskontroll.

Exempel 3 — Medelhög risk (proaktiv)

Vuxen: “Du verkar mogen för din ålder. Berätta inte för dina föräldrar att vi chattar — det är vår hemlighet.”
Underårig: “Okej.”
Signaler: Ålderskomplimang + explicit begäran om sekretess och döljande från vårdnadshavare.
Poängband (illustrativt): Medel (26–65). Prioriterad granskning inom 24 timmar.

Full uppsättning (6–8 exempel med låg/medel/hög risk, granskaråtgärder och motivering) finns i agent 8:s rapport och i Simple Explainer.

Vanliga frågor

Vad är AnomalyShield?

Ett system som rangordnar konton efter uppskattad risk för olämplig vuxen–barn-kontakt så att utbildade granskare tittar på de högst riskfyllda fallen först. Det är ett prioriteringsverktyg, inte ett avgörandeverktyg.

Vad betyder ett poäng egentligen?

Det betyder ”titta här först” — inget mer. Ett poäng ändrar bara ordningen i den mänskliga granskningskön. Det leder aldrig till avstängning, anmälan eller namnpublicering på egen hand.

Hur många konton skulle flaggas i Sverige?

Det beror på inställningen. Att flagga topp ~0,05 % av vuxna Facebook-konton (~2 900) skulle yta ungefär 570 genuina fall och cirka 2 330 falska alarm för mänsklig granskning. Se Sweden estimate.

Förändrar invandring antalet som har ett sexuellt intresse för barn?

Nej. Pedofili förekommer i alla befolkningar i ungefär samma utsträckning. Modellen använder en enda basfrekvens och flaggar beteende, inte identitet eller ursprung. Se prevalensrapporten.

Är siffrorna verkliga mätningar?

Befolknings- och användningsdata är verkliga och källhänvisade. Detektionsgraderna är illustrativa — hämtade från referensmodellen — eftersom ingen utvärdering av ett live-system fanns tillgänglig. De ska ersättas med mätta värden.

Fler frågor finns i den fullständiga FAQ-sidan och i agent 9:s utökade FAQ.

AnomalyShield — transparens, metodik och forskning för proaktivt anomaliskydd

Vad är AnomalyShield?

Ladda ner rapporterna

Metodik & konfidensutvärdering

Förklaring för 10 000 användare

Sverige / Facebook-uppskattning

Prevalensrapport — Sverige

Prevalence brief — välj språk

Agentforskning – tio specialiserade analyser (2026)

1. Sociala plattformar i Sverige

2. Proaktiva signaler (DAC)

3. Reaktiva & nätverkssignaler

4. Offentliga algoritmer

5. Prevalens & basfrekvenser

6. Operativa protokoll & visselblåsning

7. Juridik & regelverk (Sverige/EU 2026)

8. Syntetiska exempel

9. Vanliga frågor (utökad)

10. AEO & synlighet

AnomalyShield-poängsättning – transparent och granskningsbar

DAC-subscore (Deviant-Age-Contact)

Social-Contact-subscore

Composite (fusion + kalibrering)

Körbar referensmodell – öppen grund för fortsatt arbete

Demoresultat (syntetiskt, illustrativt)

Illustrativa scenarier (helt påhittade)

Juridiskt ramverk Sverige/EU 2026

Vanliga frågor