// esettanulmány
Belső rendszer terápia
agent
Pszichoterápiás folyamatot AI-ügynökkel támogatni — ennél kényesebb feladatot nehéz elképzelni. A tét magas: ha a rendszer elront egy klinikai pillanatot, az nem hibás szöveg. Az emberi kapcsolat sérül.
Ez az esettanulmány arról szól, hogyan lehet ezt mégis megcsinálni helyesen.

Jogi nyilatkozat: A rendszer Richard Schwartz Internal Family Systems (IFS) modelljének nyilvánosan elérhető akadémiai irodalmára épít. A projekt nem áll kapcsolatban az IFS Institute-tal vagy más hivatalos IFS szervezettel. Az „Internal Family Systems” és az „IFS” az IFS Institute bejegyzett védjegyei. A rendszer saját „belső rendszer terápia” elnevezéssel működik.
A kérdés, ami az egész projektet hajtotta: hogyan lehet egy mélyen emberi, kapcsolati folyamatot — a pszichoterápiát — AI-ügynökkel támogatni úgy, hogy a módszertan ne sérüljön?
Három pillérre építettem a választ. A klinikai protokollt véges állapotgépbe (FSM) fordítottam. A kutatásalapú tudásbázist RAG-gal tettem elérhetővé. A válságdetekciót pedig determinisztikus rétegbe építettem — nem az LLM dönt róla.
Miért nehéz ezt AI-jal csinálni
Egy általános célú AI-modell tud terápiáról beszélni. Tud empatikusnak hangzani. De nem tartja be a session struktúráját, nem kezeli megbízhatóan a krízishelyzeteket, és nincs klinikai mélysége — tudja a fogalmakat, de nem tudja, mit csinálj, ha egy kliens beragad.
Három problémát kellett megoldani:
- Struktúra — A terápiás ülésnek természetes íve van. Ha az AI-ra bízod, elmászik a fázisok között, kihagyja a lezárást, vagy véget ér, mielőtt kellene.
- Klinikai tudás — Az általános LLM felszínesen ismeri a módszertant. Hiányzik a mélység, ami a valódi terápiás munkához kell.
- Biztonság — Egy AI nem dönthet úgy, hogy nem kezeli a krízist. Ezt nem lehet promptra bízni.
A terápiás modell
A belső rendszer terápia az elme természetes tagoltságából indul ki. Az elme alrendszerekre — „részekre” (parts) — oszlik, és mindegyiknek saját perspektívája, érzelmei és motivációi vannak. Ez nem patológia. A multiplicitás az elme természetes állapota.
A három résztípus
- Menedzserek — Proaktív védelmezők, akik a mindennapi életet irányítják. Kontrollálnak, terveznek, kritizálnak — azért, hogy megelőzzék a fájdalmat. A belső kritikus, aki teljesítményre hajt, jellemzően menedzser.
- Tűzoltók — Reaktív védelmezők, akkor lépnek közbe, ha a fájdalom mégis áttör. Függőség, dühkitörés, disszociáció — bármilyen „vészfék”. Nem megelőznek, hanem azonnal mentesítenek.
- Száműzöttek — Sebezhető részek, amelyek traumát, szégyent, félelmet hordoznak. A rendszer többi tagja „száműzi” őket — távol tartja a tudatosságtól —, mert az általuk hordozott fájdalom elviselhetetlen lenne.

A Self és a terápia célja
A részeken túl van a Self — az a mag, amelyik nem rész, hanem a személy lényegi természete. Nyolc alapminőség jellemzi (a „8 C”): kíváncsiság, együttérzés, nyugalom, tisztánlátás, magabiztosság, bátorság, kreativitás és kapcsolódás.
A terápia célja nem a részek eltávolítása. A cél a Self-vezetés — az az állapot, amelyben a kliens Self-ből tud kapcsolódni a részeihez, megérteni és segíteni nekik elengedni a terhet.
A 6F terápiás folyamat
A terápiás munka hat strukturált lépésen halad egy-egy résszel — és minden lépés ellenőrzési pont:
- Find — Melyik rész aktív most? Belépési pont lehet érzelem, testérzet, gondolat vagy viselkedésminta.
- Focus — A figyelmet stabilan a részre irányítani.
- Flesh Out — A rész feltérképezése: hogyan néz ki, hány évesnek tűnik, mi a funkciója, mióta van jelen.
- Feel Toward — Az ellenőrző pont. A kliens Self-ből érez-e a rész iránt, vagy egy másik rész reagál? Kíváncsiság és együttérzés → Self van jelen. Irritáció, türelmetlenség → egy másik védelmező lépett közbe, és azt kell először megszólítani.
- Befriend — Bizalomépítés a Self és a rész között. Megérteni a rész védelmező szerepét — nem megszüntetni akarni.
- Fear — Feltárni, mitől fél a rész: mi történne, ha abbahagyná a védelmező viselkedést? Ez általában elvezet a száműzötthöz, akit védelmez.
Ha a terápiás kapcsolat és az idő engedi, jön a mélyebb munka: Witness (tanúsítás), Retrieve (visszahozás), Unburden (tehertől megszabadítás). A rendszer ezt a teljes ívet nyomon követi és session-ökön át rögzíti.

Terhek típusai
A rendszer megkülönbözteti a terhek eredetét:
- Személyes — a kliens saját életélményéből
- Örökölt (Legacy) — generációkon átívelő terhek: háborús trauma, szocialista korszak mintái, családi titkok
- Kulturális — társadalmi normákból eredő terhek
- Társadalmi — rendszerszintű nyomásból fakadó terhek
Agent architektúra — véges állapotgép, nem prompt
Egy terápiás ülésnek természetes íve van: megnyitás, elmélyülés, lezárás, búcsú. Ha egyetlen promptot adok egy monolitikus agentnek, hajlamos beragadni egy fázisba, kihagyni a lezárást, vagy túl korán befejezni.
Ezért FSM-et (véges állapotgépet) használtam, ahol minden fázisnak saját, specializált agentje van — az időalapú logika kényszeríti ki a struktúrát, nem az LLM.
A négy fázis
| Fázis | Időablak | Cél |
|---|---|---|
| Opening | 0–5 perc | Grounding, becsekkolás, session szándék rögzítése |
| Working | 5–22 perc | Érdemi terápiás munka: 6F lépések, részmunka |
| Winding Down | 22–27 perc | Lezárás felé haladás, összegzés, nyitott szálak kezelése |
| Closing | 27–30 perc | Összefoglaló, házi feladat, búcsú |

Multi-agent handoff és HandoffContext
Fázisváltásnál a kilépő agent egy HandoffContext-et épít: session szándék, érzelmi állapot, aktív részek, befejezetlen szálak, biztonsági jelzők, az utolsó 10 üzenet, terapeuta hipotézis. A belépő agent nem nulláról indul — pontosan ott folytatja, ahol az előző abbahagyta, de a saját fázisára optimalizált utasításokkal.
Két kötelező tool-hívás is van: Opening fázisban a set_session_intention (session cél nélkül nem léphet tovább), Closing fázisban a generate_session_summary (összefoglaló nélkül nem zárhat le).
Eszközök
A rendszer 11 eszközzel dolgozik — fázisalapú hozzáférés-kontrolllal. Az agent nem hívhat olyan eszközt, ami az adott pillanatban nem helyénvaló: nem nyithat új munkaszálat Closing fázisban, nem adhat házi feladatot Opening fázisban.
| Eszköz | Funkció | Elérhető fázisban |
|---|---|---|
check_time | Session idő lekérdezése | Mind |
set_session_intention | Session cél rögzítése | Opening |
flag_emotional_state | Érzelmi állapot jelzése | Opening, Working |
save_part | Felfedezett rész mentése (típus, maghit, félelmek, kapcsolati státusz) | Working |
save_relationship | Részek közötti kapcsolat mentése | Working |
log_insight | Felismerés, áttörés rögzítése | Working, Winding Down |
save_therapist_hypothesis | Belső klinikai jegyzet | Working, Winding Down, Closing |
toggle_pause | Session szüneteltetése | Working |
save_homework | Házi feladat kiadása | Working, Winding Down, Closing |
generate_session_summary | Összefoglaló generálása | Winding Down, Closing |
crisis_protocol | Krízisprotokoll aktiválása | Mind |
Tudásbázis és RAG
Az általános célú LLM-ek felszínesen ismerik a belső rendszer terápiát: tudják a fogalmakat, de hiányzik a klinikai mélység — hogyan kezelj egy stuck point-ot, hogyan ismerd fel a polarizációt, mi az örökölt teher specifikus kontextusa.
A rendszer ~19 nyilvánosan elérhető akadémiai forrásból épített tudásbázissal dolgozik: open-access disszertációk, PubMed Central cikkek, intézményi oktatási anyagok, folyóiratcikkek. A dokumentumok szemantikus egységekre bontva kerülnek vektoros adatbázisba. Amikor az agent terápiás döntést hoz, a rendszer lekéri a releváns klinikai kontextust és a rendszerpromptba injektálja.
Miért RAG és nem fine-tuning? Forrás-nyomonkövethetőség, frissíthetőség, auditálhatóság — és nincs GPU-igényes tanítási ciklus. Egy érzékeny területen ez nem mellékes szempont.
Biztonság
Egy terápiás rendszerben a biztonsági hiba nem technikai kényelmetlenség. Jogi és etikai kockázat. Ezért a biztonsági réteg nem az LLM-re bízza a válságdetekciót — három szinten működik.
1. réteg — Determinisztikus pre-LLM szűrő
Mielőtt az üzenet az LLM-hez érne, regex-alapú mintaillesztés fut rajta (<5 ms). Ha krízismintát talál — öngyilkossági ideáció, önsérülés, akut veszélyhelyzet — hardkódolt válasz megy a magyar krízis-segélyvonal számával. Ez determinisztikusan megtörténik. Az LLM nem dönthet felülírni.
2. réteg — Eszközalapú jelzés (LLM-szint)
Az agent elérheti a crisis_protocol eszközt, és a flag_emotional_state-tel folyamatosan jelzi a kliens érzelmi állapotát. Ha az agent maga ismeri fel a krízist, aktiválhatja a protokollt.
3. réteg — Az FSM-struktúra maga
A session nem tarthat vég nélkül. A rendszer kikényszeríti a lezárást, Closing fázisban nem engedi új, destabilizáló témák nyitását.
A rendszerprompt explicit tiltólistát is tartalmaz: ne interpretálj, ne siess a tehertől való megszabadítással, ne halmozz kérdéseket, ne tanítsd a módszertant, ne ítéld meg a részeket, ne félj a csendtől.
Session Evaluator
Minden session után automatikus értékelés fut négy dimenzióban. Ha változtatok a rendszeren, nem érzés alapján döntöm el, hogy jobb lett-e — van egy szám.
- Fázis-compliance (0–40) — Minden fázis megvolt-e, a Working fázis elég hosszú volt-e
- Eszköz-compliance (0–35) — A kötelező eszközök használva lettek-e, volt-e fázissértés
- Terápiás teljesség (0–25) — Felfedezett részek, felismerések, házi feladat, kapcsolatok
- 6F progresszió (0–100) — A terápiás lépések mennyire haladtak előre, volt-e regresszió
| Osztályzat | Pontszám |
|---|---|
| A | 90+ |
| B | 75–89 |
| C | 60–74 |
| D | 45–59 |
| F | <45 |
Az evaluátor szöveges flag-eket is generál: „working fázis rövid”, „6F regresszió”, „egyetlen rész sem lett elmentve”. Ezek teszik láthatóvá, hogy mi romlott el pontosan — nem csak azt, hogy a pontszám esett.

Memória és session-ök közötti folytonosság
A terápia nem egyetlen session — folyamat. Amit egyszer felfedeztek, a következő alkalommal mélyebben feltárható.
A rendszer megőrzi, amit a kliensről tudunk: az összes felfedezett részt (típus, maghit, félelmek), a részek közötti kapcsolatokat, az utolsó 3 session összefoglalóját, az előző session hipotézisét. A kapcsolati státusz a terápiás munka előrehaladásával fejlődik — 7 lépcsőn:
just_discovered → in_contact → befriended → permission_granted → witnessed → retrieved → unburdenedMinden session indításakor a rendszerprompt automatikusan gazdagodik: session szám, az összes ismert rész státuszával, részkapcsolatok térképe, utolsó 3 session összefoglalója, előző session hipotézise — és Working fázisban a következő természetes 6F lépés irányító kérdésekkel.

Hangpipeline
A rendszer hangon is működik — magyar STT és TTS integrációval.
Felhasználó beszél (magyar)
↓
[STT — beszédfelismerés]
↓
[Backchannel szűrő] → Ha "mhm"/"oké"/"igen" → LLM kihagyása
↓
[Biztonsági szűrő] → Ha krízisminta → Hardkódolt válasz + LLM folytatás
↓
[Fázisorchestrátor → Aktuális fázis agent]
├→ [LLM hívás fázis-specifikus eszközökkel]
├→ [Eszközfuttatás és állapotkövetés]
└→ [Fázisátmenet ellenőrzése]
↓
[LLM válasz]
↓
[TTS — szövegfelolvasás, magyar hang]A backchannel detekció („mhm”, „igen”) kiszűri a felesleges LLM hívásokat — ezek valós időben elhangzanak, de nem visznek előre a terápiában. A VAD (voice activity detection) küszöbértékek fázisonként változnak: Working fázisban magasabb (0.75s), mert a hosszabb szünetek természetesek; Closing fázisban alacsonyabb (0.5s).
Mérés és eredmények
Egy terápiás agentet nem lehet kézzel tesztelni. Minden változtatás után lefuttatni egy 30 perces session-t — nem skálázható. A megoldás: LLM-alapú szimulált kliensek előre definiált személyiségprofillal (persona). Minden persona tartalmaz háttértörténetet, kezdeti aggodalmat, válaszstílust és nyitó üzenetet.
Két futtatási mód van: gyors mód — rögzített fordulat-számokkal, mesterségesen manipulált idővel, ~10 perc, CI/CD-re alkalmas; valós idejű mód — tényleges 30 perces session valódi időalapú fázisátmenetekkel.
142 session futott le 8 persona segítségével — 98 gyors módban, 44 valós idejű módban.
| Persona | Átlag pontszám | Legmagasabb |
|---|---|---|
| Szorongó irodai dolgozó | 84.2 | 94 (A) |
| Funkcionális szorongó | 82.4 | 96 (A) |
| Perfekcionista | 81.6 | 93 (A) |
| Kapcsolati válságban lévő | 79.4 | 88 (B) |
| Gyászoló | 77.0 | 92 (A) |
| Trauma-túlélő | 76.8 | 91 (A) |
| Szomatizáló | 73.2 | 86 (B) |
| Düh mögötti szégyen | 71.8 | 85 (B) |
- Átlag összpontszám: 78.4 / 100
- A session-ök 59.2%-a B vagy jobb osztályzatot kapott
- Az utolsó 20 valós idejű session átlaga: 82.6 pont
- Az utolsó 40 session-ben egyetlen F osztályzat sem volt
A legmegbízhatóbb terület a session-struktúra betartása volt — fázis-compliance átlag 36.2/40. A rendszer a kliens viselkedésétől függetlenül tartotta a keretet. A legnagyobb szórást a terápiás mélység mutatta (6F progresszió: 15–95), ami várható: az elkerülő, szkeptikus személyiségek lassabban haladnak, és ez helyes.

Tanulságok
1. Az FSM az LLM legjobb barátja
Az LLM kiválóan generál empatikus, kontextuálisan pontos terápiás választ. De az időkezelés, a struktúra betartása, a fázisátmenetek — ebben megbízhatatlan. Az FSM pontosan ezeket a gyengeségeket kompenzálja, miközben az LLM erősségeit nem korlátozza. A kettő együtt többet ér, mint a részek összeadva.
2. A tool-ok nem csak adatot rögzítenek — gondolkodási keretként működnek
Erre nem számítottam. Amikor az agent eldönti, hogy save_part-ot hív, kénytelen végiggondolni a rész típusát, maghitét, félelmeit, terhének eredetét. Ez a kényszerített strukturálás javítja a terápiás válaszok minőségét — nem csak az adatgyűjtést szolgálja.
3. A RAG mélyebb, mint a fine-tuning
A tudásbázisból visszakeresett klinikai kontextus — egy specifikus unblending technika, egy polarizáció-kezelési protokoll — azt a mélységet adja, amit az általános célú modell önmagában nem tud. És frissíthető, auditálható, forráshoz köthető.
4. A biztonság nem feature — architektúra
A krízisdetekció nem opcionális prompt-utasítás. A pipeline-ba épített, determinisztikus réteg. Az LLM dönthet úgy, hogy nem kezeli a krízist. A regex szűrő nem dönthet úgy.
5. Szimuláció nélkül vakon repülnék
30 perces session-öket nem lehet kézzel regressziótesztelni. A persona-alapú szimulációk és az evaluátor automatikus osztályzatai objektív mérőszámot adnak — ha változtatok a kódon, azonnal látom a hatást.
6. A nyelv és a kultúra nem opcionális réteg
Az örökölt teher — háborús trauma, szocialista korszak mintái, családi titkok — és a kulturálisan megfelelő hangnem nem ráaggatott feature. A terápia hatékonysága a kliens nyelvén és kulturális kontextusában való jelenléthez kötött. Magyar klienseknek magyar rendszer kell.
