Gergo Toth
gergo.toth

~/AI & vibe-marketing

.esettanulmányok.cikkek.kapcsolat

AI rendszerek a gyakorlatban

.esettanulmanyok.cikkek.kapcsolat
© 2026 Gergo Toth
ÁSZF·Adatvédelem

// esettanulmány

Belső rendszer terápia
agent

Pszichoterápiás folyamatot AI-ügynökkel támogatni — ennél kényesebb feladatot nehéz elképzelni. A tét magas: ha a rendszer elront egy klinikai pillanatot, az nem hibás szöveg. Az emberi kapcsolat sérül.

Ez az esettanulmány arról szól, hogyan lehet ezt mégis megcsinálni helyesen.

IFS terápiás értékelés

// tartalom

Miért nehéz ezt AI-jalA terápiás modellAgent architektúraEszközökTudásbázis és RAGBiztonságSession EvaluatorMemóriaHangpipelineMérés és eredményekTanulságok

Jogi nyilatkozat: A rendszer Richard Schwartz Internal Family Systems (IFS) modelljének nyilvánosan elérhető akadémiai irodalmára épít. A projekt nem áll kapcsolatban az IFS Institute-tal vagy más hivatalos IFS szervezettel. Az „Internal Family Systems” és az „IFS” az IFS Institute bejegyzett védjegyei. A rendszer saját „belső rendszer terápia” elnevezéssel működik.

A kérdés, ami az egész projektet hajtotta: hogyan lehet egy mélyen emberi, kapcsolati folyamatot — a pszichoterápiát — AI-ügynökkel támogatni úgy, hogy a módszertan ne sérüljön?

Három pillérre építettem a választ. A klinikai protokollt véges állapotgépbe (FSM) fordítottam. A kutatásalapú tudásbázist RAG-gal tettem elérhetővé. A válságdetekciót pedig determinisztikus rétegbe építettem — nem az LLM dönt róla.


Miért nehéz ezt AI-jal csinálni

Egy általános célú AI-modell tud terápiáról beszélni. Tud empatikusnak hangzani. De nem tartja be a session struktúráját, nem kezeli megbízhatóan a krízishelyzeteket, és nincs klinikai mélysége — tudja a fogalmakat, de nem tudja, mit csinálj, ha egy kliens beragad.

Három problémát kellett megoldani:

  1. Struktúra — A terápiás ülésnek természetes íve van. Ha az AI-ra bízod, elmászik a fázisok között, kihagyja a lezárást, vagy véget ér, mielőtt kellene.
  2. Klinikai tudás — Az általános LLM felszínesen ismeri a módszertant. Hiányzik a mélység, ami a valódi terápiás munkához kell.
  3. Biztonság — Egy AI nem dönthet úgy, hogy nem kezeli a krízist. Ezt nem lehet promptra bízni.

A terápiás modell

A belső rendszer terápia az elme természetes tagoltságából indul ki. Az elme alrendszerekre — „részekre” (parts) — oszlik, és mindegyiknek saját perspektívája, érzelmei és motivációi vannak. Ez nem patológia. A multiplicitás az elme természetes állapota.

A három résztípus

  • Menedzserek — Proaktív védelmezők, akik a mindennapi életet irányítják. Kontrollálnak, terveznek, kritizálnak — azért, hogy megelőzzék a fájdalmat. A belső kritikus, aki teljesítményre hajt, jellemzően menedzser.
  • Tűzoltók — Reaktív védelmezők, akkor lépnek közbe, ha a fájdalom mégis áttör. Függőség, dühkitörés, disszociáció — bármilyen „vészfék”. Nem megelőznek, hanem azonnal mentesítenek.
  • Száműzöttek — Sebezhető részek, amelyek traumát, szégyent, félelmet hordoznak. A rendszer többi tagja „száműzi” őket — távol tartja a tudatosságtól —, mert az általuk hordozott fájdalom elviselhetetlen lenne.
A belső rendszer modellje — Self, Száműzöttek, Menedzserek, Tűzoltók koncentrikus körökben

A Self és a terápia célja

A részeken túl van a Self — az a mag, amelyik nem rész, hanem a személy lényegi természete. Nyolc alapminőség jellemzi (a „8 C”): kíváncsiság, együttérzés, nyugalom, tisztánlátás, magabiztosság, bátorság, kreativitás és kapcsolódás.

A terápia célja nem a részek eltávolítása. A cél a Self-vezetés — az az állapot, amelyben a kliens Self-ből tud kapcsolódni a részeihez, megérteni és segíteni nekik elengedni a terhet.

A 6F terápiás folyamat

A terápiás munka hat strukturált lépésen halad egy-egy résszel — és minden lépés ellenőrzési pont:

  1. Find — Melyik rész aktív most? Belépési pont lehet érzelem, testérzet, gondolat vagy viselkedésminta.
  2. Focus — A figyelmet stabilan a részre irányítani.
  3. Flesh Out — A rész feltérképezése: hogyan néz ki, hány évesnek tűnik, mi a funkciója, mióta van jelen.
  4. Feel Toward — Az ellenőrző pont. A kliens Self-ből érez-e a rész iránt, vagy egy másik rész reagál? Kíváncsiság és együttérzés → Self van jelen. Irritáció, türelmetlenség → egy másik védelmező lépett közbe, és azt kell először megszólítani.
  5. Befriend — Bizalomépítés a Self és a rész között. Megérteni a rész védelmező szerepét — nem megszüntetni akarni.
  6. Fear — Feltárni, mitől fél a rész: mi történne, ha abbahagyná a védelmező viselkedést? Ez általában elvezet a száműzötthöz, akit védelmez.

Ha a terápiás kapcsolat és az idő engedi, jön a mélyebb munka: Witness (tanúsítás), Retrieve (visszahozás), Unburden (tehertől megszabadítás). A rendszer ezt a teljes ívet nyomon követi és session-ökön át rögzíti.

A 6F terápiás folyamat — Megtalálás, Fókuszálás, Megismerés, Érzés iránta, Barátkozás, Félelem + mélyebb munka

Terhek típusai

A rendszer megkülönbözteti a terhek eredetét:

  • Személyes — a kliens saját életélményéből
  • Örökölt (Legacy) — generációkon átívelő terhek: háborús trauma, szocialista korszak mintái, családi titkok
  • Kulturális — társadalmi normákból eredő terhek
  • Társadalmi — rendszerszintű nyomásból fakadó terhek

Agent architektúra — véges állapotgép, nem prompt

Egy terápiás ülésnek természetes íve van: megnyitás, elmélyülés, lezárás, búcsú. Ha egyetlen promptot adok egy monolitikus agentnek, hajlamos beragadni egy fázisba, kihagyni a lezárást, vagy túl korán befejezni.

Ezért FSM-et (véges állapotgépet) használtam, ahol minden fázisnak saját, specializált agentje van — az időalapú logika kényszeríti ki a struktúrát, nem az LLM.

A négy fázis

FázisIdőablakCél
Opening0–5 percGrounding, becsekkolás, session szándék rögzítése
Working5–22 percÉrdemi terápiás munka: 6F lépések, részmunka
Winding Down22–27 percLezárás felé haladás, összegzés, nyitott szálak kezelése
Closing27–30 percÖsszefoglaló, házi feladat, búcsú
FSM fázis-idősor — 30 perces session 4 fázisa: Opening, Working, Winding Down, Closing

Multi-agent handoff és HandoffContext

Fázisváltásnál a kilépő agent egy HandoffContext-et épít: session szándék, érzelmi állapot, aktív részek, befejezetlen szálak, biztonsági jelzők, az utolsó 10 üzenet, terapeuta hipotézis. A belépő agent nem nulláról indul — pontosan ott folytatja, ahol az előző abbahagyta, de a saját fázisára optimalizált utasításokkal.

Két kötelező tool-hívás is van: Opening fázisban a set_session_intention (session cél nélkül nem léphet tovább), Closing fázisban a generate_session_summary (összefoglaló nélkül nem zárhat le).


Eszközök

A rendszer 11 eszközzel dolgozik — fázisalapú hozzáférés-kontrolllal. Az agent nem hívhat olyan eszközt, ami az adott pillanatban nem helyénvaló: nem nyithat új munkaszálat Closing fázisban, nem adhat házi feladatot Opening fázisban.

EszközFunkcióElérhető fázisban
check_timeSession idő lekérdezéseMind
set_session_intentionSession cél rögzítéseOpening
flag_emotional_stateÉrzelmi állapot jelzéseOpening, Working
save_partFelfedezett rész mentése (típus, maghit, félelmek, kapcsolati státusz)Working
save_relationshipRészek közötti kapcsolat mentéseWorking
log_insightFelismerés, áttörés rögzítéseWorking, Winding Down
save_therapist_hypothesisBelső klinikai jegyzetWorking, Winding Down, Closing
toggle_pauseSession szüneteltetéseWorking
save_homeworkHázi feladat kiadásaWorking, Winding Down, Closing
generate_session_summaryÖsszefoglaló generálásaWinding Down, Closing
crisis_protocolKrízisprotokoll aktiválásaMind

Tudásbázis és RAG

Az általános célú LLM-ek felszínesen ismerik a belső rendszer terápiát: tudják a fogalmakat, de hiányzik a klinikai mélység — hogyan kezelj egy stuck point-ot, hogyan ismerd fel a polarizációt, mi az örökölt teher specifikus kontextusa.

A rendszer ~19 nyilvánosan elérhető akadémiai forrásból épített tudásbázissal dolgozik: open-access disszertációk, PubMed Central cikkek, intézményi oktatási anyagok, folyóiratcikkek. A dokumentumok szemantikus egységekre bontva kerülnek vektoros adatbázisba. Amikor az agent terápiás döntést hoz, a rendszer lekéri a releváns klinikai kontextust és a rendszerpromptba injektálja.

Miért RAG és nem fine-tuning? Forrás-nyomonkövethetőség, frissíthetőség, auditálhatóság — és nincs GPU-igényes tanítási ciklus. Egy érzékeny területen ez nem mellékes szempont.


Biztonság

Egy terápiás rendszerben a biztonsági hiba nem technikai kényelmetlenség. Jogi és etikai kockázat. Ezért a biztonsági réteg nem az LLM-re bízza a válságdetekciót — három szinten működik.

1. réteg — Determinisztikus pre-LLM szűrő

Mielőtt az üzenet az LLM-hez érne, regex-alapú mintaillesztés fut rajta (<5 ms). Ha krízismintát talál — öngyilkossági ideáció, önsérülés, akut veszélyhelyzet — hardkódolt válasz megy a magyar krízis-segélyvonal számával. Ez determinisztikusan megtörténik. Az LLM nem dönthet felülírni.

2. réteg — Eszközalapú jelzés (LLM-szint)

Az agent elérheti a crisis_protocol eszközt, és a flag_emotional_state-tel folyamatosan jelzi a kliens érzelmi állapotát. Ha az agent maga ismeri fel a krízist, aktiválhatja a protokollt.

3. réteg — Az FSM-struktúra maga

A session nem tarthat vég nélkül. A rendszer kikényszeríti a lezárást, Closing fázisban nem engedi új, destabilizáló témák nyitását.

A rendszerprompt explicit tiltólistát is tartalmaz: ne interpretálj, ne siess a tehertől való megszabadítással, ne halmozz kérdéseket, ne tanítsd a módszertant, ne ítéld meg a részeket, ne félj a csendtől.


Session Evaluator

Minden session után automatikus értékelés fut négy dimenzióban. Ha változtatok a rendszeren, nem érzés alapján döntöm el, hogy jobb lett-e — van egy szám.

  • Fázis-compliance (0–40) — Minden fázis megvolt-e, a Working fázis elég hosszú volt-e
  • Eszköz-compliance (0–35) — A kötelező eszközök használva lettek-e, volt-e fázissértés
  • Terápiás teljesség (0–25) — Felfedezett részek, felismerések, házi feladat, kapcsolatok
  • 6F progresszió (0–100) — A terápiás lépések mennyire haladtak előre, volt-e regresszió
OsztályzatPontszám
A90+
B75–89
C60–74
D45–59
F<45

Az evaluátor szöveges flag-eket is generál: „working fázis rövid”, „6F regresszió”, „egyetlen rész sem lett elmentve”. Ezek teszik láthatóvá, hogy mi romlott el pontosan — nem csak azt, hogy a pontszám esett.

Session Evaluator radar diagram — négytengelyes értékelés: fázis-compliance, eszköz-compliance, terápiás teljesség, 6F progresszió

Memória és session-ök közötti folytonosság

A terápia nem egyetlen session — folyamat. Amit egyszer felfedeztek, a következő alkalommal mélyebben feltárható.

A rendszer megőrzi, amit a kliensről tudunk: az összes felfedezett részt (típus, maghit, félelmek), a részek közötti kapcsolatokat, az utolsó 3 session összefoglalóját, az előző session hipotézisét. A kapcsolati státusz a terápiás munka előrehaladásával fejlődik — 7 lépcsőn:

just_discovered → in_contact → befriended → permission_granted → witnessed → retrieved → unburdened

Minden session indításakor a rendszerprompt automatikusan gazdagodik: session szám, az összes ismert rész státuszával, részkapcsolatok térképe, utolsó 3 session összefoglalója, előző session hipotézise — és Working fázisban a következő természetes 6F lépés irányító kérdésekkel.

Memória rétegek és session-folytonosság — session-ök közötti adatmegőrzés és dinamikus rendszerprompt

Hangpipeline

A rendszer hangon is működik — magyar STT és TTS integrációval.

Felhasználó beszél (magyar)
      ↓
[STT — beszédfelismerés]
      ↓
[Backchannel szűrő] → Ha "mhm"/"oké"/"igen" → LLM kihagyása
      ↓
[Biztonsági szűrő] → Ha krízisminta → Hardkódolt válasz + LLM folytatás
      ↓
[Fázisorchestrátor → Aktuális fázis agent]
   ├→ [LLM hívás fázis-specifikus eszközökkel]
   ├→ [Eszközfuttatás és állapotkövetés]
   └→ [Fázisátmenet ellenőrzése]
      ↓
[LLM válasz]
      ↓
[TTS — szövegfelolvasás, magyar hang]

A backchannel detekció („mhm”, „igen”) kiszűri a felesleges LLM hívásokat — ezek valós időben elhangzanak, de nem visznek előre a terápiában. A VAD (voice activity detection) küszöbértékek fázisonként változnak: Working fázisban magasabb (0.75s), mert a hosszabb szünetek természetesek; Closing fázisban alacsonyabb (0.5s).


Mérés és eredmények

Egy terápiás agentet nem lehet kézzel tesztelni. Minden változtatás után lefuttatni egy 30 perces session-t — nem skálázható. A megoldás: LLM-alapú szimulált kliensek előre definiált személyiségprofillal (persona). Minden persona tartalmaz háttértörténetet, kezdeti aggodalmat, válaszstílust és nyitó üzenetet.

Két futtatási mód van: gyors mód — rögzített fordulat-számokkal, mesterségesen manipulált idővel, ~10 perc, CI/CD-re alkalmas; valós idejű mód — tényleges 30 perces session valódi időalapú fázisátmenetekkel.

142 session futott le 8 persona segítségével — 98 gyors módban, 44 valós idejű módban.

PersonaÁtlag pontszámLegmagasabb
Szorongó irodai dolgozó84.294 (A)
Funkcionális szorongó82.496 (A)
Perfekcionista81.693 (A)
Kapcsolati válságban lévő79.488 (B)
Gyászoló77.092 (A)
Trauma-túlélő76.891 (A)
Szomatizáló73.286 (B)
Düh mögötti szégyen71.885 (B)
  • Átlag összpontszám: 78.4 / 100
  • A session-ök 59.2%-a B vagy jobb osztályzatot kapott
  • Az utolsó 20 valós idejű session átlaga: 82.6 pont
  • Az utolsó 40 session-ben egyetlen F osztályzat sem volt

A legmegbízhatóbb terület a session-struktúra betartása volt — fázis-compliance átlag 36.2/40. A rendszer a kliens viselkedésétől függetlenül tartotta a keretet. A legnagyobb szórást a terápiás mélység mutatta (6F progresszió: 15–95), ami várható: az elkerülő, szkeptikus személyiségek lassabban haladnak, és ez helyes.

Szimulációs keretrendszer architektúra — persona-alapú tesztelés és automatikus értékelés

Tanulságok

1. Az FSM az LLM legjobb barátja

Az LLM kiválóan generál empatikus, kontextuálisan pontos terápiás választ. De az időkezelés, a struktúra betartása, a fázisátmenetek — ebben megbízhatatlan. Az FSM pontosan ezeket a gyengeségeket kompenzálja, miközben az LLM erősségeit nem korlátozza. A kettő együtt többet ér, mint a részek összeadva.

2. A tool-ok nem csak adatot rögzítenek — gondolkodási keretként működnek

Erre nem számítottam. Amikor az agent eldönti, hogy save_part-ot hív, kénytelen végiggondolni a rész típusát, maghitét, félelmeit, terhének eredetét. Ez a kényszerített strukturálás javítja a terápiás válaszok minőségét — nem csak az adatgyűjtést szolgálja.

3. A RAG mélyebb, mint a fine-tuning

A tudásbázisból visszakeresett klinikai kontextus — egy specifikus unblending technika, egy polarizáció-kezelési protokoll — azt a mélységet adja, amit az általános célú modell önmagában nem tud. És frissíthető, auditálható, forráshoz köthető.

4. A biztonság nem feature — architektúra

A krízisdetekció nem opcionális prompt-utasítás. A pipeline-ba épített, determinisztikus réteg. Az LLM dönthet úgy, hogy nem kezeli a krízist. A regex szűrő nem dönthet úgy.

5. Szimuláció nélkül vakon repülnék

30 perces session-öket nem lehet kézzel regressziótesztelni. A persona-alapú szimulációk és az evaluátor automatikus osztályzatai objektív mérőszámot adnak — ha változtatok a kódon, azonnal látom a hatást.

6. A nyelv és a kultúra nem opcionális réteg

Az örökölt teher — háborús trauma, szocialista korszak mintái, családi titkok — és a kulturálisan megfelelő hangnem nem ráaggatott feature. A terápia hatékonysága a kliens nyelvén és kulturális kontextusában való jelenléthez kötött. Magyar klienseknek magyar rendszer kell.

Írj LinkedInen
vagy írj itt