Back to standard

AIFC-064: Data Classification

Status: Draft 0.1 Standard: AI-First Community Standard Zkráceně: AIFC Navazuje na:

Účel dokumentu: Definovat Data Classification jako základní bezpečnostní a governance mechanismus pro AIFC knowledge base, source of truth, Operational DNA, metadata, AI inputs, AI outputs, derived knowledge, audit logs, interfaces a cross-community sharing. Data Classification umožňuje řídit přístup, AI zpracování, sdílení, export, audit, retention a ochranu komunitního know-how podle citlivosti a dopadu.


1. Purpose of this document

Tento dokument definuje Data Classification.

AIFC komunita pracuje se znalostmi, které mohou být veřejné, interní, citlivé nebo kritické.

Tyto znalosti nejsou jen data.

Mohou obsahovat:

Bez klasifikace nelze odpovědně rozhodnout:

Data Classification je základ pro bezpečné fungování AI-first komunity.


2. Core principle

Základní princip tohoto dokumentu je:

Classify knowledge by sensitivity, purpose and impact on community capability.

Česky:

Klasifikujte know-how podle citlivosti, účelu a dopadu na schopnost komunity.

AIFC říká:

Do not classify only files.
Classify capability exposure.

Česky:

Neklasifikujte pouze soubory.
Klasifikujte odhalení schopnosti.

V AI-first komunitě může být největší riziko v tom, že dobře strukturovaný souhrn odhalí víc než jednotlivé dokumenty.


3. Definition

Data Classification je řízený mechanismus, kterým komunita označuje data, knowledge artefakty, metadata, AI vstupy, AI výstupy, derived knowledge, audit logs, interfaces a další informační aktiva podle jejich citlivosti, účelu, rizika a dopadu.

Data Classification určuje:

Minimum requirement

Každý významný knowledge artefakt musí mít klasifikaci nebo ji dědit z umístění, typu, workflow, ownera nebo pravidla.


4. Why Data Classification matters

Bez klasifikace komunita neví, co chrání.

To vede ke dvěma extrémům.

První extrém:

Everything is open.

Výsledek:

Druhý extrém:

Everything is restricted.

Výsledek:

Dobrá klasifikace umožňuje chránit citlivé a zároveň sdílet bezpečné.

Minimum requirement

Data Classification musí podporovat ochranu i použitelnost knowledge base.


5. Classification is not only confidentiality

Klasifikace není jen otázka důvěrnosti.

AIFC klasifikace má zohlednit:

Například public dokument může mít nízkou důvěrnost, ale vysoký reputační dopad.

Interní metadata mohou mít malý textový obsah, ale vysokou schopnost odhalit strategii.

Minimum requirement

Klasifikace musí zohlednit dopad, ne pouze tajnost.


AIFC doporučuje základní klasifikační vrstvy:

Public
Internal
Restricted
Operational DNA

Tento model může komunita rozšířit podle právních, oborových nebo organizačních potřeb.

Minimum requirement

Komunita musí mít jasně definované klasifikační úrovně a jejich význam.


7. Public

Public jsou informace určené k veřejnému sdílení.

Příklady:

Public neznamená bez ownera.

Public artefakty musí být stále správné, aktuální, schválené a reviewované.

Rizika:

Minimum requirement

Public artefakty vycházející z interní knowledge base musí mít ownera, status a public release review.


8. Internal

Internal jsou informace určené pro komunitu nebo organizaci.

Příklady:

Internal neznamená, že obsah lze vložit do libovolné AI.

Internal neznamená, že jej lze poslat vendorovi.

Internal neznamená, že neobsahuje citlivá metadata.

Minimum requirement

Internal artefakty musí mít pravidla pro external sharing a AI processing.


9. Restricted

Restricted jsou citlivé informace s omezeným přístupem.

Příklady:

Restricted artefakty vyžadují:

Minimum requirement

Restricted artefakty musí mít ownera, access control, AI processing rule, export rule a audit přiměřený riziku.


10. Operational DNA

Operational DNA je kritické know-how, které popisuje nebo umožňuje schopnost komunity.

Příklady:

Operational DNA je nejcitlivější klasifikace.

Únik může znamenat ztrátu schopnosti, konkurenční výhody, bezpečnosti, autonomie nebo důvěry.

Minimum requirement

Operational DNA musí mít nejvyšší ochranu, omezený přístup, explicitní AI-NDA Boundary, audit, export control a ownera.


11. Classification by content

Klasifikace může vycházet z obsahu artefaktu.

Například:

Minimum requirement

Klasifikace musí zohlednit skutečný obsah artefaktu, ne pouze jeho název nebo umístění.


12. Classification by context

Stejný obsah může mít jinou klasifikaci podle kontextu.

Příklad:

A general description of a workflow may be Internal.

The same workflow combined with customer patterns, decision logic and automation rules may become Operational DNA.

Kontext může zahrnovat:

Minimum requirement

Klasifikace musí zohlednit kontext použití a kombinace informací.


13. Classification by aggregation

Agregace může zvýšit citlivost.

Jednotlivé dokumenty mohou být Internal.

Ale jejich syntéza může být Restricted nebo Operational DNA.

Příklad:

Minimum requirement

Aggregated or synthesized knowledge must be classified by the sensitivity of what it reveals, not only by input classifications.


14. Derived knowledge classification

AI často vytváří derived knowledge.

Derived knowledge je nový poznatek vytvořený z existujících vstupů.

Může být:

Derived knowledge může být citlivější než vstupy.

Minimum requirement

AI-generated derived knowledge musí být klasifikováno podle dopadu a toho, co odhaluje.


15. Metadata classification

Metadata mohou být citlivá.

Příklady metadat:

Metadata mohou odhalit strukturu, priority nebo slabiny komunity.

Minimum requirement

Metadata musí být klasifikována nebo chráněna podle toho, co odhalují.


16. Prompt and output classification

Prompty a AI výstupy musí být klasifikovány.

Prompt může obsahovat citlivá data.

Výstup může obsahovat:

Minimum requirement

Kritické AI prompts and outputs musí mít klasifikaci nebo audit policy, která řeší jejich citlivost.


17. Audit log classification

Audit logs mohou být vysoce citlivé.

Mohou odhalit:

Minimum requirement

Audit logs musí mít vlastní klasifikaci a access control.


18. Interface classification

Community Interface, Enterprise Interface a public interface musí být klasifikovány.

Interface může být veřejný, interní nebo restricted.

Riziko vzniká, když interface odhaluje:

Minimum requirement

Interfaces musí být reviewované proti Operational DNA exposure a podle toho klasifikované.


19. Skill classification

Human skills a AI skills mohou mít různou citlivost.

Public skill:

Internal skill:

Restricted skill:

Operational DNA skill:

Minimum requirement

Skills musí být klasifikovány podle schopnosti, kterou odhalují.


20. Agent permission classification

Agent permissions samy mohou být citlivé.

Mohou odhalit:

Minimum requirement

Agent permissions musí mít klasifikaci a access control přiměřený riziku.


21. Decision record classification

Decision records mohou být public, internal, restricted nebo Operational DNA.

Záleží na tom, co rozhodnutí odhaluje.

Decision record může obsahovat:

Minimum requirement

Decision records musí mít klasifikaci podle obsahu, dopadu a audience.


22. Classification and AI-NDA Boundary

AI-NDA Boundary musí být odvozena z klasifikace.

Příklad:

Public:
AI processing allowed by default unless restricted by policy.

Internal:
AI processing allowed only with approved tools or rules.

Restricted:
AI processing requires AI-NDA Boundary and purpose limitation.

Operational DNA:
AI processing requires explicit approval, strict boundary, audit and usually private or controlled environment.

Minimum requirement

Každá klasifikační úroveň musí mít pravidlo pro AI processing.


23. Classification and access control

Access Control vychází z klasifikace.

Klasifikace určuje:

Minimum requirement

Access rules musí být mapované na classification levels.


24. Classification and export

Export je rizikový zejména u Restricted a Operational DNA.

Export pravidla musí řešit:

Minimum requirement

Restricted a Operational DNA export musí vyžadovat explicitní approval a audit.


25. Classification and public release

Public release je změna klasifikace směrem ven.

Musí být zkontrolováno:

Minimum requirement

Převod interního nebo citlivého know-how do public výstupu musí mít public release review.


26. Classification and retention

Klasifikace ovlivňuje retention.

Public obsah může být držen dlouhodobě.

Internal obsah může mít review cycle.

Restricted obsah může mít omezenou retenci.

Operational DNA může vyžadovat dlouhodobou ochranu, ale také pravidelné review a kontrolu přístupu.

Audit logs mohou mít samostatná retention pravidla.

Minimum requirement

Klasifikační úrovně musí mít retention nebo review pravidla.


27. Classification and deletion

Deletion musí respektovat klasifikaci.

Něco musí být smazáno kvůli právu nebo boundary.

Něco nesmí být smazáno kvůli auditu.

Něco má být archivováno.

Něco musí být odstraněno z agent memory, embeddings nebo cache.

Minimum requirement

Sensitive classification levels must have deletion, archive or retention rules.


28. Classification and embeddings

Embeddings a vector stores musí dědit klasifikaci ze zdrojů.

Pokud se zdroj změní, smaže nebo omezí, musí se řešit:

Minimum requirement

Embeddings z Restricted nebo Operational DNA obsahu musí být chráněny stejnou nebo vyšší úrovní jako zdroj.


29. Classification and aggregation in Human Cockpit Layer

Human Cockpit Layer může ukazovat agregace.

Agregace může odhalit citlivé informace i tehdy, když jednotlivé položky nejsou zobrazeny.

Příklad:

Minimum requirement

Human Cockpit Layer musí klasifikovat agregované pohledy podle toho, co odhalují.


30. Classification and cross-community sharing

Při sdílení mezi komunitami musí být jasné:

Minimum requirement

Cross-community sharing of non-public knowledge requires classification mapping or explicit sharing boundary.


31. Classification inheritance

Klasifikace může být děděna.

Například:

Dědičnost pomáhá snížit friction.

Ale nesmí být slepá.

Obsah může vyžadovat vyšší klasifikaci než default.

Minimum requirement

Klasifikační dědičnost musí umožnit zvýšení klasifikace podle obsahu a dopadu.


32. Classification override

Někdy je potřeba klasifikaci změnit.

Override musí být řízený.

Příklady:

Minimum requirement

Snížení klasifikace Restricted nebo Operational DNA musí vyžadovat approval.


33. Classification review

Klasifikace může zastarat.

Review se ptá:

Minimum requirement

Restricted a Operational DNA artefakty musí mít classification review cycle nebo trigger.


34. AI-assisted classification

AI může pomáhat s klasifikací.

Může:

AI však nesmí sama snížit klasifikaci kritického artefaktu bez approval.

Minimum requirement

AI-assisted classification must be marked as proposal until approved for Restricted or Operational DNA artefacts.


35. Misclassification

Misclassification je špatné označení citlivosti.

Příklady:

Misclassification je knowledge security risk.

Minimum requirement

Misclassification incidents musí být zaznamenány a řešeny podle dopadu.


36. Classification and values

Klasifikace není jen technické pravidlo.

Odráží hodnoty komunity.

Například:

Příliš nízká klasifikace může porušit důvěru.

Příliš vysoká klasifikace může poškodit učení a spolupráci.

Minimum requirement

Classification policy musí vyvažovat bezpečnost, transparentnost, učení a odpovědnost.


37. Classification and Human Capability Reserve

Pokud je kritické know-how příliš uzavřené, komunita může ztratit schopnost obnovy.

Proto je potřeba vytvářet:

Klasifikace má chránit, ne zničit schopnost učení.

Minimum requirement

Operational DNA protection musí být vyvážena s Human Capability Reserve přes bezpečné human-readable variants nebo training paths.


38. Classification and AI lock-in

Pokud citlivé know-how existuje jen v AI vendor platformě, agent memory nebo proprietary skill store, klasifikace i kontrola se oslabují.

AIFC preferuje, aby klasifikace kritických artefaktů byla držena ve source of truth nebo governance repository.

Minimum requirement

Kritické klasifikované artefakty nesmí být autoritativně klasifikovány pouze v AI vendor systému.


39. Classification policy

AIFC komunita má mít classification policy.

Ta definuje:

Minimum requirement

Komunita pracující s neveřejným know-how musí mít classification policy nebo ekvivalent.


40. Suggested metadata

Příklad metadat pro klasifikaci artefaktu:

classification:
  level: public | internal | restricted | operational_dna
  owner:
  reason:
  inherited_from:
  contains_personal_data: true | false
  contains_secrets: true | false
  contains_customer_data: true | false
  contains_operational_dna: true | false
  ai_processing:
    allowed: true | false
    rule: public_allowed | approved_tools_only | redaction_required | private_environment_only | explicit_approval_required | forbidden
    ai_nda_boundary:
  export:
    allowed: true | false
    approval_required: true | false
    redaction_required: true | false
  sharing:
    internal_allowed: true | false
    external_allowed: true | false
    cross_community_boundary_required: true | false
  audit_required: true | false
  retention_rule:
  review_cycle:
  last_reviewed:

Příklad metadat pro classification review:

classification_review:
  id:
  title:
  status: scheduled | in_progress | approved | changed | escalated | closed
  artefact:
  current_classification:
  proposed_classification:
  reason:
  ai_assisted: true | false
  reviewer:
  approval_required: true | false
  decision:
  decision_record:
  created_at:
  closed_at:

Příklad metadat pro misclassification incident:

misclassification_incident:
  id:
  title:
  status: observed | triaged | contained | corrected | under_review | closed
  artefact:
  original_classification:
  corrected_classification:
  incident_type:
    - under_classified
    - over_classified
    - missing_classification
    - public_leak
    - ai_processing_violation
    - export_violation
    - metadata_leak
    - derived_knowledge_misclassified
  affected_communities:
  ai_involved: true | false
  impact:
  corrective_actions:
  related_change_proposal:
  owner:
  created_at:
  closed_at:

Tyto struktury jsou ilustrativní.

Finální schéma má být definováno v agent-actionable vrstvě standardu.


41. Anti-patterns

AIFC odmítá následující anti-patterny.

41.1 No classification

Knowledge artefakty nemají klasifikaci a přístup se řídí náhodou nebo pohodlím.

41.2 Classification by folder only

Umístění v adresáři určuje klasifikaci, ale obsah se nekontroluje.

41.3 Everything internal

Komunita označí vše jako internal a ignoruje Restricted a Operational DNA.

41.4 Everything restricted

Komunita označí vše jako restricted a zabije učení, onboarding a spolupráci.

41.5 AI output unclassified

AI výstupy se používají bez klasifikace, i když obsahují derived knowledge.

41.6 Metadata ignored

Metadata nejsou chráněna, i když odhalují citlivé informace.

41.7 Aggregation ignored

Agregace nebo syntéza zvýší citlivost, ale klasifikace se nezmění.

41.8 Public release without review

Interní obsah je publikován bez kontroly Operational DNA exposure.

41.9 AI declassification

AI sama sníží klasifikaci bez lidského approval.

41.10 Vendor classification mismatch

Komunita sdílí data s vendorem, ale neověří, zda vendor uznává stejnou klasifikaci a boundary.

41.11 Embeddings without classification

Embeddings z restricted obsahu jsou uložené jako běžný technický artefakt.

41.12 Classification as bureaucracy

Klasifikace je vnímána jen jako compliance checkbox, ne jako ochrana schopnosti komunity.


42. Minimal requirements

AIFC komunita musí v oblasti Data Classification minimálně splnit:

  1. Významné knowledge artefakty mají klasifikaci nebo ji dědí z pravidla.
  2. Data Classification podporuje ochranu i použitelnost knowledge base.
  3. Klasifikace zohledňuje dopad, ne pouze tajnost.
  4. Komunita má jasně definované klasifikační úrovně.
  5. Public artefakty vycházející z interní knowledge base mají ownera, status a public release review.
  6. Internal artefakty mají pravidla pro external sharing a AI processing.
  7. Restricted artefakty mají ownera, access control, AI processing rule, export rule a audit.
  8. Operational DNA má nejvyšší ochranu, omezený přístup, AI-NDA Boundary, audit, export control a ownera.
  9. Klasifikace zohledňuje skutečný obsah artefaktu.
  10. Klasifikace zohledňuje kontext použití a kombinace informací.
  11. Aggregated or synthesized knowledge is classified by what it reveals.
  12. AI-generated derived knowledge je klasifikováno podle dopadu.
  13. Metadata jsou klasifikována nebo chráněna podle toho, co odhalují.
  14. Kritické AI prompts and outputs mají klasifikaci nebo audit policy.
  15. Audit logs mají vlastní klasifikaci a access control.
  16. Interfaces jsou reviewované proti Operational DNA exposure.
  17. Skills jsou klasifikovány podle schopnosti, kterou odhalují.
  18. Agent permissions mají klasifikaci a access control.
  19. Decision records mají klasifikaci podle obsahu, dopadu a audience.
  20. Každá klasifikační úroveň má pravidlo pro AI processing.
  21. Access rules jsou mapované na classification levels.
  22. Restricted a Operational DNA export vyžaduje approval a audit.
  23. Převod interního nebo citlivého know-how do public výstupu má public release review.
  24. Klasifikační úrovně mají retention nebo review pravidla.
  25. Sensitive classification levels mají deletion, archive nebo retention rules.
  26. Embeddings z Restricted nebo Operational DNA obsahu jsou chráněny jako zdroj.
  27. Human Cockpit Layer klasifikuje agregované pohledy podle toho, co odhalují.
  28. Cross-community sharing of non-public knowledge requires classification mapping or explicit sharing boundary.
  29. Klasifikační dědičnost umožňuje zvýšení klasifikace podle obsahu a dopadu.
  30. Snížení klasifikace Restricted nebo Operational DNA vyžaduje approval.
  31. Restricted a Operational DNA artefakty mají classification review cycle nebo trigger.
  32. AI-assisted classification is marked as proposal until approved for Restricted or Operational DNA.
  33. Misclassification incidents jsou zaznamenány a řešeny podle dopadu.
  34. Classification policy vyvažuje bezpečnost, transparentnost, učení a odpovědnost.
  35. Operational DNA protection je vyvážena s Human Capability Reserve přes bezpečné variants nebo training paths.
  36. Kritické klasifikované artefakty nejsou autoritativně klasifikovány pouze v AI vendor systému.
  37. Komunita pracující s neveřejným know-how má classification policy nebo ekvivalent.

43. Summary

Data Classification je základ bezpečné AI-first knowledge base.

Bez klasifikace není možné odpovědně řídit:

AIFC proto říká:

Classify what knowledge reveals.
Classify what AI derives.
Classify what aggregation exposes.
Classify what capability depends on.

Česky:

Klasifikujte to, co know-how odhaluje.
Klasifikujte to, co AI odvodí.
Klasifikujte to, co agregace vystaví.
Klasifikujte to, na čem závisí schopnost.

Správná klasifikace umožňuje komunitě sdílet bezpečně, chránit cíleně a používat AI bez ztráty kontroly.

Data Classification turns knowledge sensitivity into governed protection and usable trust.