Ebben a bejegyzésben feltérképezzük a székelyföldi (Hargita, Kovászna és Maros megyei) városokból elszármazottakat, Erdély-, Románia-, Európa- és világszerte – és egy interaktív adatvizualizáción keresztül bemutatjuk a Székelyföldi Diaszpórát: Facebook-bányászattal adatokat gyűjtünk, geolokalizált tortadiagramokkal elemzünk és egy érdekes eloszlási törvényre is rávilágítunk! Kiderül, hol lakik a 100.000 emigráns/ideiglenesen külföldön elő/dolgozó/tanuló székelyföldi.

This post is about mapping the diaspora of the Székely people as they spread out across the countries of the world. Using Facebook-mining of location and birth-place data, we construct a comprehensive picture and investigate the statistics using geolocated piecharts and Sankey diagrams. In the end, we highlight the existence of the rank-size distribution among the target settlements of the Székely emigrants and scale the findings of the sample to the full population.

Számtalanszor hallottuk már, hogy a világ exponenciálisan növekedik – vagy éppen zsugorodik: Nagyapáink számára a 10 kilométerre található szomszédos falu már majdnem külföldnek számított. Ez a volt a maximum távolság, ha “elköltöztek”. Szüleink az iparosodás hullámával megtízszerezték ezt a távolságot és a 100 km-re található nagyobb város lett a cél, bár a rendszerváltáskor sokan bevállalták az 1000 kilométeres utat és átköltöztek Magyarországra – immár “igazán” külföldre. A mi generációnk nem egyszer ennek többszörösét tesszük meg, amikor hazautazunk – néha akár 10 000 kilométert is, más földrészről hazatérve, óceánon át. De hányan?

Hivatalosan ehhez az információigényhez meglennének az állami statisztikák, akár több évre visszamenőleg is. Köztudott azonban, hogy az uniós határok megnyílása óta ezek a statisztikák merőben félrevezethetnek, hisz nem mindenki jelenti önként be, hogy most éppen külföldön dolgozik/tanul/lakik, sőt… Ezért egy sokkal innovatívabb – furfangosabb 🙂 – módszer alkalmzasához folyamodtunk: a közösségi-média-bányászathoz (social media mining). Facebook-on be lehet jelölni a születési-, illetve jelenlegi lakhelyet. A Facebook felemelkedésének korában ez publikus információ volt és bár azóta lehetséges a letiltása, sok felhasználó esetében ez a mai napig elérhető. A Graph Search-ön egy egyszerű keresést lefuttatva megjeleníthető, hogy egy adott városban (például Csíkszereda) születettek hol laknak jelenleg (persze a kisebb településeknek általában több – akár 10 – nevük is van, de a Facebook a városokat automatikusan egy egységes azonosítóval látja el). A Graph Search keresőoldala korlátozza ugyan a megjelenített találatokat, de egy ügyes böngésző-automatizálással akár  több ezer találatot is betölthetünk (gyakorlatilag amíg megtelik a számítógépünk memóriája).

Ezt a kereső algoritmust lelfuttatuk 16 erdélyi városra, Hargita, Kovászna és Maros megye legnagyobb településeire (* Parajd nem város hivatalosan, de méreteiben annak tekinthető). Némelyek esetében az összes (publikus születési helyinformációval rendelkező) Facebook-felhasználót megtaláltuk az adott városból (kimerítő keresés – exhaustive search). A statisztikai függetlenség érdekében, két egymástól teljesen független keresési epizódot tartottunk, sőt, az egyiket egy frissen regisztrált, 0-barátos felhasználóval, valamint a másikat egy saját, néhány éves, Székelyföldet többé-kevésbé behálózó kapcsolatokkal rendelkező felhasználóval. Azonban nem minden felhasználó, akinek publikus a születési helye, osztja meg a lakhelyét is, valamint néhány esetben az adatok használhatatlanok, így az egész keresésnek egy minőségi szűrésen kellett először átmennie. Figyelembe véve a vizsgált városok népességét, valamint a lakosság Facebook-felhasználó arányát (illetve adatmegosztásra való hajlamosságát), meglepően sok adatot sikerült összegyűjtenünk – összesen 61789 felhasználóprofilt. Az elemzés megkönnyítése érdekében a találat/profil/kivándorló/elszármazott/külföldön letelepedett kifejezést a találatok kontextusában fogjuk használni – megjegyezve, hogy ez természetesen sok esetben csak ideiglenes ott-tartózkodást jelent. A városok azonosítására az elemzés során egy állandó színkódot fogunk használni, mely az alábbi táblázatban szerepel, a bányászott adatokkal együtt (népességi adatok a 2011-es romániai népszámlálás alapján): Csíkszereda: 2320 profil, ebből használható:  1857, ez a lakosság ( 37980 ) 4.89 %-a – a felső sor mindig a régebbi profillal van bejelentkezve.

Város Profil OK Lakos %
Csíkszereda 2320 1857 37980 4.89
(második epizód) 1715 1368 37980 3.6
Székelyudvarhely 2180 1793 34257 5.23
II. 1638 1307 34257 3.82
Sepsiszentgyörgy 2314 1888 54312 3.48
II. 1645 1321 54312 2.43
Marosvásárhely 2236 1739 134290 1.29
II. 2191 1803 134290 1.34
Barót 2194 1908 8567 22.27
II. 2051 1768 8567 20.64
Gyergyószentmiklós 2264 1837 18377 10.0
II. 1883 1495 18377 8.14
Kézdivásárhely 2188 1805 18491 9.76
II. 2031 1658 18491 8.97
Székelykeresztúr 2300 2013 9491 21.21
II. 1961 1598 9491 16.84
Kovászna 2244 1786 10265 17.4
II. 2002 1616 10265 15.74
Balánbánya 2216 1842 5864 31.41
II. 1967 1635 5864 27.88
Szentegyháza 590 519 6820 7.61
II. 1834 1585 6820 23.24
Parajd 1116 1000 6502 15.38
II. 1124 995 6502 15.3
Szováta 1491 1301 10234 12.71
II. 1495 1317 10234 12.87
Szászrégen 2242 1874 33281 5.63
II. 1988 1668 33281 5.01
Segesvár 1765 1439 28102 5.12
II. 2128 1748 28102 6.22
Maroshévíz 2250 1893 13285 14.25
II. 2226 1863 13285 14.02

A nagy városok esetében a lakosok 3-5%-a felelt meg a keresési kritériumoknak (kivéve Marosvásárhely, itt az arány 1.3% a nagy népesség miatt), míg a kisebbeknél ez majdnem az egyharmadot is elérte. A 10 000-nél kevesebb lakosú városokban a keresés teljesen kimerítő volt – azaz nem maradt feltérképezetlen felhasználó. Ezzel azonnal hozzájutunk ahhoz az információhoz, hogy (* ha a városok közötti trendek nem merőben elétérőek) a székelyföldi városi lakosság egynegyedének-egyötödének van publikus helységmegjelöléssel ellátott Facebook-profilja (Balánbánya kivételével, ahol ez az arány valamivel nagyobb – majd még erre később visszatérünk). Ha egy konzervatív becsléssel az összes Facebook felhasználót ennek a duplájára, azaz a teljes városi lakosság felére (215059) tesszük, akkor bármelyik felhasználó elérhető két közbeeső barát segítségével (3 lépés távolság – minden felhasználónak 60, páronként nem közös barátot feltételezve, ezen a blogon már volt erről szó).

Az így bányászott helységadatokat geokódóltuk, majd a világtérképre vetítettük, városok szerinti színkodolással – megkapva ezáltal a székelyföldi városok egységes (Facebook-alapú) emigránstérképét. A célvárosokat méretarányos pöttyökkel jelöltük, valamint, ha egy célváros több székelyföldi forrásvárossal bír, akkor méretarányos tortadiagramokká alakítottuk a pöttyöket (a pöttyök méretének skálája nem lineáris és 50 főnél maximalizálódik!).

Székelyföldi diaszpóra
Hargita,Kovászna  és Maros megye városaiból elszármazottak szerte a világban
(interaktív – teljes képernyő, statikus)

A fenti adatvizualizáció nagyon sok böngésznivalót rejt magában:

  • A bal oszlopban található menüpontokban egy bizonyos régióra közelíthetünk rá.
  • Ki/be kapcsolhatjuk a vándorlási vonalakat (ez jelentősen leterheli a grafikus processzort).
  • Az egeret az egyes székelyföldi, menüben felsorolt városok fölé mozgatva szűrhejtük a megjelenített pontokat, valamint kattintva el is tűntethetjük ezeket – lehetőséget nyújtva pl. csak egy bizonyos város diaszpóráját vizsgálni.
  • Az egyes célvárosok és célországok fölött időzve információkat kapunk az odavándoroltakról.
  • Országokra kattintva ráközelíthetünk egyes országok városaira, valamint a vándorlási vonalak is automatikusan követik a választásunk.
  • Görgővel, valamint dupla kattintással nagyíthatunk/kicsinyíthetünk a térképen.
  • Bármely óceánra való kattintással visszatérünk a kezdeti világnézetbe.
  • Ne felejtsük, hogy az itt megjelenített számok maguk a valós, bányászott számok!

 

szekely_diaszpora1

Székelyföldi diaszpóra – Globális (interkatív – teljes képernyő)

A globális képet vizsgálva láthatjuk, hogy a világ csaknem minden pontjára eljutottak a székelyföldiek, Grönlandtól Tahitiig, Madagaszkártól Szibériáig. Első látásra nincs különösebb meglepetés, és a bejegyzés elején bemutatott exponenciális történet is helyt áll: Az észek-amerikai kontinensen és az Öreg Hölgyön kívül nagyon szétszórt a diaszpóra, Európát mindjárt külön vizsgáljuk. Ázsiában (Közel-Kelet nélkül) ~50, Dél-Amerikában kb. 30, Ausztráliában és Afrikában 10-10 találat volt. A Közel-Keleten összesen ~100 honfitárs él, ebből 30-30 Cipruson és Izraelben, valamint 16, illetve 17 Irakban és az Egyesült Arab Emírségekben.

szekely_diaszpora2

Székelyföldi diaszpóra – Amerika (interaktív – teljes képernyő)

Amerikában és Kanadában 233, illetve 65 találat született, javarészt a hagyományos magyarországi letelepedési vonalak mentén: New York, Toronto, Chicago és Los Angeles rendelkeznek 10-nél több hosszab-rövidebb ideig ott tartózkodó székelyföldivel. A többi nagyváros, Miami, Atlanta, Montreal és Calgary következnek a sorban. A 16 székelyföldi város mindenike majdnem a lakosságával arányosan van jelen az amerikai kontinensen.

Székelyföldi diaszpóra - Európa

Székelyföldi diaszpóra – Európa (interaktív – teljes képernyő)

Természetesen Európa a legfőb emigrációs célpont, ám a célországok a székelyföldi régiók sajátosságainak megfelelően váltakoznak. Romániára 23421 találat érkezett, de ez magában foglalja a születési településükön élőket is. Magyarországon 2723, Németországban 1109, az Egyesült Királyságban 743, Olaszországban 612, Ausztriában 210 elszármazottat pipálhatunk ki.

Székelyföldi diaszpóra - Európa: Maroshévíz, Balánbánya

Székelyföldi diaszpóra – Európa: Maroshévíz, Balánbánya (interaktív – teljes képernyő)

Valószínüleg kulturális és kapcsolati-ismerősi hálójuk sajátosságaira alapozva, a maroshévíziek és balánbányaiak messze leggyakoribb célpontja Olaszország – e két település adja az olaszországi találatok kétharmadát! De Magyarország és Németország és az Egyesült Királyság is fő célpont. A balánbányán születettek diaszpórája óriási és a vizsgált városok közül messze ez foglalja magában a legtöbb egyéni céltelepülést.

Székelyföldi diaszpóra - Európa: Csík, Gyergyó, Udvarhely

Székelyföldi diaszpóra – Európa: Csík-, Gyergyó-, Udvarhelyszék (interaktív – teljes képernyő)

A csíki-, gyergyói- és udvarhelyszékiek messze leginkább az anyaországi vonalon mozognak, ezt követi Németország és az Egyesült Királyság angliai része. A gyergyóiak, a két fenti városhoz hasonlóan, a déli településekhez képest nagyobb arányban merészkednek távolabbra.

Székelyföldi diaszpóra - Európa: Háromszék

Székelyföldi diaszpóra – Európa: Háromszék (interaktív – teljes képernyő)

A háromszékiek is hasonló vándorlási vonalat követnek, részben a területeken átívelő kapcsolati hálóknak köszönhetően, bár Németországban jóval többen és Angliában is túlsúlyban vannak az északi székekbeliekhez képest. Ám Németországban a marosmegyei – szász – vidékek lakói vannak a legtöbben.

Székelyföldi diaszpóra - Európa: Marosszék

Székelyföldi diaszpóra – Európa: Marosszék (interkatív – teljes képernyő)

Németország mellett Olaszországban és Spanyolországban is száznál több találatra leltünk. Németországot Magyarországnál is többen választják Marosszékről célpontul, főként a segesváriak és a szászrégeniek.

Érdemes megfigyelni, hogy mennyire urbán-szelektív emigrációról beszélhetünk: míg egyes országokba a kivándorlás egyenletesen eloszlik a kisebb-nagyobb városok között – erre tökéletes példa Magyarország, területe teljesen le van fedve pöttyökkel (bár itt is Budapesten lakik az emigránsok egyharmada!) – máshol rendkívül központosított és a fővárosra és környékére redukálódik – Írország, Anglia, Franciaország, Ausztria. A Németországéhoz hasonló gazdasági helyzettel, területtel rendelkező Franciaországban csak tizedannyian találtak végleges vagy ideiglenes otthonra (ebben kétségkívül térségünk történelme, de például az idegennyelv-oktatás is közrejátszik) és a néhai NSZK és NDK határát a mai napig akár szabad kézzel, fehér krétával rajzolhatnánk a térképre – mi több, a Német Köztársaságon belül is főként Bajorország a székelyföldiek célpontja – valószínüleg kulturális, illetve gazdasági szálakon. A volt szovjet blokk államaiba még Afrikánál is kevesebben költöznek, ám a Kanári-szigetekre annál többen.

Székelyföldi diaszpóra - Románia

Székelyföldi diaszpóra – Románia (interaktív – teljes képernyő)

Az országon belüli mozgás legalább annyira népes, mint az emigráció. A székelyföldiek természetesen a nagyvárosokba tartanak – tanulni, dolgozni, szerencsét próbálni – de itt is megfigyelhetőek regionális különbségek. Bukarestben kevesebb, mint feleannyian vannak, mint Budapesten (438 vs. 1078) és ebből pl. csíki csak 25, udvarhelyi 5. Talán kevesebb egyetemista marad az egyetemista városokban, mint előre sejtenénk – de Kolozsvárnak továbbra is hatalmas a szívóereje: tizenhétszerakkora, mint Temesvárnak vagy Nagyváradnak! A székelyföldi városok mindenikéből 100-200-an próbálnak szerencsét jelenleg Kolozsváron a Facebook szerint. A következő a rangsorban Marosvásárhely, feleakkora sármmal, mint Kolozsvár, majd következik Csíkszereda és Brassó. A balánbányai diaszpóra látványosan terül el az egész ország területén, egy évszázados iparág hanyatlásának hagyatékaként. A segesvári diaszpóra, bár méretében kisebb, hasonlóan terebélyes.

Székelyföldi diaszpóra - Székelyföld

Székelyföldi diaszpóra – Székelyföld (interaktív – teljes képernyő)

Székelyföldre közelítve láthatjuk, hogy azért nem olyan nagy a baj, a székelyföldi városok mindenikében az “otthoniak” vannak messze a legtöbben. A Gyergyószékiek sokkal inkább az Olt völgye felé költöznek, mint a Maros irányába, akárcsak a csíkiak, bár ez utóbbiak az erdélyi nagyvárosokat is előszeretettel veszik célba. Az udvarhelyiek a medencéjük adottságait kihasználva, annak mind a négy kijáratának irányába előszeretettel költöznek falvakba, akárcsak a háromszékiek, míg a csíkiak kénytlenek az Olt-sávban maradni. Marosszék a régió többi részével és a többi erdélyi nagyvárossal is erős migrációs kapcsolatban áll (*a kis székelyföldi települések nevei helyenként tíznél is több formában jelentek meg az adatbányászat során, nem egyszer Hargita és Kovászna megye felcserélésével – ebből kifolyólag van néhány szembeötlő geokódolási hiba, de ezek az következtetéseinket jelentős mértékben nem befolyásolják).

Székelyföldi városok migrációs arányai
(interaktív – teljes képernyő, statikus)

Ha megvizsgáljuk a 16 város migrációs arányait, láthatjuk, hogy átlagosan a találatok egynede jelölt meg külföldi települést mostani lakóhelyéül. Az országon belül más megyékbe költözöttek száma viszont nagyon régiófüggő. A balánbányán születettek majdnem fele már más megyében lakik, míg 39%-uk külföldön él – azaz csak 11% az, aki otthon maradt. Ezzel szemben a háromszékiek és udvarhelyszékiek alig költöznek más megyébe, gyakorta inkább külföldre. Az alábbi Sankey típusú folyamatábrákon országokra és megyékre lebontva mutatjuk be a nacionális és internacionális emigrációt. Ezekről a vizualizációkról jól kivehetőek az egyes városok kedvelt célországai, célmegyéi. Minden város lakosságát 100-al szimbolizáltuk, és a városokból induló folyamathúrok ennek megfelelően méretarányosak. A megyeközti mozgás esetében a születési helyükön élőket most nem vettük figyelembe, ezért csak az elköltözőket jeleníti meg a diagram.

Székelyföldi városok migrációjának százalékos folyamatábrái
(interaktív – teljes képernyő ország | megye, statikus ország | megye)


Bár a Facebook profilok szerinti diaszpóra nominális értékei önmagukban is rendkívül hasznosak, az igazi feladat lefordítani a Facebook-számokat valós népességi becslésekre. Talán a legegyszerűbb lehetőség az, hogy feltételezve, hogy a jelengi minta reprezentatív (végtére is több, mint a lakosság 5%-a a legtöbb város esetében – 2%-os vagy annál kisebb hibaküszöböt jelent) és az emberek egyenlő eséllyel választanak országot, illetve várost, véletlenszerűen elosztjuk a a lakosság maradék 95%-át a világ városaiban. Igenám, csakhogy az emberek egy közösségi hálóban élnek és az emigráció is ennek a hálózati törvényein alapul – gondoljunk csak bele: egy olyan városba, ahol már nagyon sok városbeli, potenciális barát, ismerős, rokon él, nagyobb eséllyel jut el valaki, mint egy teljesen idegen helyre, egyedül. Mi több, ez az esély jóval nagyobb.

Tegyük fel, hogy egy Sepsiszentgyörgyön született lakos külföldre költözne és elméletileg mehetne Berlinbe és Prágába. Berlinben már 30 más szentgyörgyi, volt ismerőse, barátja várja, Prágában viszont csak 10. Ha feltételezzük, hogy ennek hatására háromszor nagyobb eséllyel választja Berlint (a csíkszredai Barabási Albert László és Albert Réka által kidolgozott lineáris preferenciális csatolódási modell – preferential attachment – alapján), akkor Londonba, ahol 1000 szentgyörgyi van, százszor akkora eséllyel jut el, mint Prágába. Ezt az eredményezi, hogy egy idő után majdnem minden szentgyörgyi emigráns Londonban köt ki. Ez a legtöbb közzöségi hálózat – mint amilyen feltételezhetően az emigrációs kapcsolati háló is – sajátossága. Tehát a lakosságra csakis úgy lehetne átvetíteni a Facebook-bányászat során nyert eredményeket, hogy a már meglévő közösségek a jelenlegi méretükkel (és rangsorban elfoglalt helyüket megőrizve!) arányosan osztanánk szét a lakosságot. Ez azonban nem ennyire egyszerű, mert egy nemlineáris probléma: sajnos nem tudhatjuk, hogy a jelenlegi, körülbelül 5%-os mintánk a hálozat legösszekötötteb (hub), vagy leggyengébb (leaf) láncszemeit vonultatja fel – ehhez a Facebook graph-search algoritmusát kellene mélyen tanulmányozni, ugyanakkor lehet hogy egy nagyon befolyásos ismerős nemrég utazott ki egy kisebb városba és az ottani közösség még csak most kezd el ennek hatására növekedni.

Azonban, ahogy az elején említettük, néhány város esetében kimerítő volt a keresés – azaz a megtalálható személyek mindenikét feltérképeztük. Ha feltételezzük, hogy kellően sokan vállalták a publikus helyzetmegosztást a profiljukon (ami alapbeállításban publikus, maga a felhasználó kell deaktiválja), akkor valóban reprezentatív mintát kapunk a városról. Persze azt újra nagyon nehéz megállapítani, hogy mekkora például a kapcsolati hálóátfedettség két város vagy két régió polgárai között – és külön a forrásváros és a célváros esetében.

Van viszont egy másik törvény is, ami a városok, mint települések sajátosságaira vontakozik: a rangsor-méret szabály (Argentína, USA). A rangsor-méret szabály szerint a legnagyobb társadalmi egységek exponenciálisan nagyobbak, mint a kisebbek. Ez annyit tesz: a világon a legnagyobb (egy-két) igazán népes országhoz (India, Kína) képest, a rangsorban népességre következő 3.-4. (Amerika, Indonézia, Brazília, Pakisztán, Banglades) feleakkora, a következő 5.-6. újra feleakkora (Oroszország, Nigéria, Japán), és így tovább. Ha a rangsor-méret szabályt egy adott, fizikailag határolt (területben vagy népességben) társadalomra alkalmazzuk (például a világ népessége, vagy egy országon belüli, immigráció nélküli népesség) akkor azt jelenti, hogy a legnagyobb társadalmi egységekből exponenciálisan sokkal kevesebb van, mint a kisebbekből. Ez a szabály meglepően igaz országon belüli városokra is (pl. Bukarest -> Kolozsvár, Temesvár -> Iași, Konstanca, Craiova, Galac, Brassó -> … ). Ezt az összefüggést matematikailag egy (egyébként a fent említett preferenciális csatolódási modell  – preferential attachment – ami ilyen típusú  skálafüggetlen – scale-free – hálózatot eredményez is ez alapján definiálható) hatványtörvénnyel (power law) írhatjuk le. Ez röviden annyit tesz, hogy a magyarázó és a magyarázott változó logaritmusai lineárisan függenek egymástól.

Ezt szem előtt tartva megvizsgáltuk a székelyföldi diaszpóra városaiban élők számának és a célvárosaik méretének (ott élő székelyföldi emigránsok száma alapján) közötti összefüggéseket és egy hatványtörvényre illesztettük őket.

Székelyföldi diaszpóra - Rangsor-méret szabálya

Székelyföldi diaszpóra – Rangsor-méret szabálya

A viszonylag kis mintákon alapuló statisztiák meglepően jól illeszkednek a hatványtörvényhez. A városok külön-külön (bal oldali ábra) majdnem teljes mértékben követik a hatványtörvény egyenesét és az összesített eredmények (jobb oldali ábra) is meglepően jó korrelációt mutatnak – az első 16 pont maguk a városok, amik természetesen kivételek a szabály alól. A törvény minden 20 és 200 közötti székelyföldi lakosú városra igaz. Ez anyit jelent: a székelyföldi diaszpóra legnagyobb városában tartózkodók exponenciálisan többen vannak, mint a második legnagyobb városban tartózkodók, és így tovább, amíg a városok túl picik nem lesznek.

Székelyföldi diaszpóra - Gyakoriság-méret szabálya

Székelyföldi diaszpóra – Gyakoriság-méret szabálya

Ha a rangsort gyakoriságra cseréljük, akkor még szembetűnőbb a hatványtörvény szabályszerűsége (bár ide kapcsolódó kutatás és matemakailag indokolt magyarázatunk nincs rá!). Azaz a diaszpóra legnagyobb városából csak egy van, második legnagyobból egy néhány, és a legkisebbekől (egy-két személyes települések) meg nagyon sok.

Bár a lineáris preferenciális csatolódási elve megengedné a kisebb városok aránybeli növekedését, és a hálózatmodell algoritmusának alkalmazásával használhatnánk a diaszpóra jövőbeli növekedésének megjósolásához, a rangsor-méret szabály hálózatelméleti boncolgatása – bár igencsak érdekes téma – még várat a mélyebb tanulmányozásra. Ennek eddig főként az adatok elérhetősége szabott gátat, ám az itt bemutatott közösségi-média bányászatra alapozó eljárások egy alternatív lehetőséget nyújtanak erre – jóllehet erre csak az elmúlt 2-3 évben nyílt valós elérhetőség. Megtörténhet, hogy a városok esetében a hálózatnövekedési szabály erősebb, mint lineáris (pl. exponenciálisan preferenciális csatolódás), ám ez nagyon sok bizonytalan kérdést vet fel és tanulmányozása nagyon komoly kutatást igényel.

Éppen ezért egy egyszerű lineáris modell alapján rávetítettük a teljes lakosságot a Facebook-mintákra, hogy megkapjuk Székelyföld hozzávetőleges, de teljes diaszpóráját. A fent levezetett gondolatmenet alapján, a nagyvárosoknak a valóságban nagyobbaknak kell lenniük és a kisvárosokban egyrészt kevesebben vannak, másrészt pedig valószníüleg, új eddig meg nem jelölt helyeken jelennének meg pöttyök. Tovább a marosvásárhelyi minta kis százalékos aránya ebben az esetben a maroszvásárhelyi hibaküszöböt megemeli, kiváltképp a kis települések esetében.

Teljes székelyföldi diaszpóra
Hargita,Kovászna  és Maros megye városaiból elszármazottak szerte a világban
(interaktív – teljes képernyő, statikus)

Az így nyert adatok alapján, a 430118 fős székelyföldi városi lakosság 77.2%-a (332200 fő) él az ország határain belül és 97918 emigráns – ebből 34 ezer Kolozsváron – és ezzel egyáltalán nem vagyunk messze más statisztikusok becslésétől (akik 1987-2004 között számoltak!) – egyszerű Facebook adatok alapján! Példaként, Csíkszereda papíron ~38.000-es lakossága így 21461-re módosul, ebből 14481 “törzsgyökeres” csíki. Romániában, Hargita megyén kívül még 6300 csíki él, majd’ 3000 Kolozsvárott és 1500 Marosvásárhelyen. Az országon kívülre 9800(!) csíki jut, ebből Magyarországon 5000-en laknak. A többi székelyföldi város esetében is hasonló az eloszlás.

Angliában 11762 székelyföldi keresi a kenyerét – ebből Londonban 4100 (Sok magyar médium a magyarországi londoniakat százezerre becsüli – ehhez képest ez a becslés meglepően jól tartja a székelyföldi-magyarországi lakosságarányokat!). Németországban 15466-an dolgoznak, laknak, tanulnak, egyenletesen eloszolva Bajorország-szerte. Magyarországot 36425-en választották, ebből majdnem fele a fővárost. Az Egyesült Államokban 4356, Kanadában 976, Spanyolországban 3424, Olaszországban 5605, Svédországban 1280, Dániában 2099, Ausztriában 3308, Franciaországban 1441, Svájcban 1684 székelyföldi próbál jelenleg szerencsét. Ezennel mindenkinek mindenhez sok sikert és kitartást kívánunk! Meg persze az otthoniaknak is. Főleg 😉

Ne feledjük, hogy:

  • Az elemzés teljes mértékben és előirányozottan publikus Facebook-adatokon alapszik.
  • A Facebook-felhasználók demográfiája majdnem teljesen biztosan nem adja vissza a valós székelyföldi demográfiát.
  • Ugyanakkor a külföldön élők talán nagyobb eséllyel használnak Facebookot, ezáltal növelve a külföldi adatok hitelességét.
  • A külföldön élők talán nagyobb eséllyel állítják be a jelenlegi tartózkodási helyüket.
  • Nem mindenki adja meg a valós lakhelyét
  • Elírt (és a Facebook által automatikusan nem beazonosított) településnevek geokódolási hibákat vezethetnek be – mind a forrás, mind a céltelepülések esetében
  • Az elemzés kizárólag csak 16 Hargita, Kovászna és Maros megyei város adatainak alapján készült. E városok összesített lakossága a 2011-es romániai népszámlálás alapján 430118. Székelyföld lakossága 2014-ben 858466, a három megye összesített lakossága pedig 1119583 volt.
  • Míg a lakosságadatok frissek, a találatok kivándorlása akár évekkel ezelőtt is történhetett. Mivel a Székelyföldi városok lakossága köztudottan jelentősen csökkent az elmúlt két évtizedben, valószínű, hogy a kivándorlók egy része valós kivándorló és nem szerepel már a népességi nyilvántartásban. Ezt az eredményezi, hogy a emigráció valós mértéke valamivel kisebb, mint azt az elemzésünk mutatja.
  • A publikus Facebook adatok sok bányászott profilon nem csak a jelenlegi tartózkodási helyet rejti, hanem a személyek foglalkozását, munkahelyét, oktatását is. Adatfeldolgozás szempontjából ez valóságos aranybánya: egy jövőbeli bejegyzésben megvizsgáljuk, hogy milyen munkakörben dolgoznak külföldön (vagy éppen otthon) ezek az emberek és milyen oktatással a hátuk mögött, valamint, hogy ezek összefüggenek-e egymással.

UPDATE: Platon Arnold barátom – az erdélyi térkép- és adatvizualizációs guru – egy picit tovább maszírozta a fenti adatsorokat. Bemutatom mire jutott (az alábbi infografikonok és a szöveg is az ő munkája – kisebb hozzátoldásokkal):

Székelyföldi diaszpóra - Kedvelt célországok városok szerint (teljes képernyő)

Székelyföldi diaszpóra – Kedvelt célországok városok szerint (teljes képernyő)

Ha az egyes városokat célországaik eloszlása szerint oszlopgrafikonokon ábrázoljuk, könnyen észrevehetjük, hogy a többségben román ajkú Maroshévíz, illetve Balánbánya szülöttei az újlatin nyelveket beszélő országokban (FR-Franciaország, ES-Spanyolország, IT-Olaszország) túlreprezentáltak. Tudva, hogy a román nép nyelvileg újlatin, kulturálisan frankofil, míg a magyarok inkább a német befolyásoltságú közép-európai kulturával azonosulnak, érdemes megnéznünk, hogy van-e összefüggés a városok etnikai összetétele és a hozzárendelt kulturáis gyökerek, illetve a választott célországok között – és nyilvánvalóan van. Hogy erre rámutassunk, az adathalmazból kiszűrtük a Franciaországba, Spanyolországba és Olaszországba, illetve Németországba, Ausztriába és Svájcba vándoroltakat (bár Svájc etnikailag egyharmad újlatin – francia, olasz és rétoromán – történelmi és politikai magja a német részen van, és a lakosság kétharmada németakjú).

12765800_10154506921931124_937505717_o


Székelyföldi városok román-magyar etnikai összetétele, illetve az európai újlatin és germán célországok között összefüggés (teljes képernyő)

A székelyföldi városokat a román-magyar etnikai összetételük szerint rendeztük (a 2011-es népszámlálás alapján), illetve a diaszpóráik összetételét a germán avagy újlatin célországok szerint. Amint az várható volt, viszonylag erős korreláció van a városok etnikai összetétele és a választott célországok nyelvi-kulturális gyökerei között. Az adatokra illesztett regressziós görbe szerint (R2) a nyelv az országválasztás 57%-ért felelős!

Két, Székelyföldre specifikus dologra szeretnénk még felhívni a figyelmet: sok abszolút magyarajkú (95%-nál több) város nem illeszkedik teljesen a vonalra, mivel a se nem germán se nem újlatin Magyarország a fő kivándorlási célpont. Ugyanakkor Segesvár (és kisebb mértékben Szászrégen) diaszpórája sokkal inkább germánabb, mint azt a román-magyar etnikai összetétel jósolná – természetesen az évszázados szász kultúra hagyatékának nyomaként.


ADATOK + KÓD: A bejegyzéshez felhasznált adatokat a Facebook közösségi oldal Graph-Search keresőjének automatizálásával gyűjtöttük, ezzel a Microsoft Excel macroval és egy automatizált Internet Explorer böngészővel. Két, egymástól független adatgyűjtési epizódot vezettük le, egy teljesen friss, valamint egy többéves régiséggel rendelkező felhasználóval. Az adatbányászat egy Core i5-ös, 4GB memóriájú Windows 10-en futó, hordozható számítógépen 48 órát vett igénybe. Az így kapott adatokat JSON formátumba dolgoztuk fel ezzel a Jupyter munkafüzettel, pandas használatával. Az adatok tisztogatása és normalizálása 24 órát vett igénybe. Ezután az interaktív vizualizációkat d3.js és matplotlib felhasználásával készítettük, 48 óra alatt. A színeket colorbrewer segítségével választottuk és a Righteous betűtípust használtuk. A háttérkutatás és a bejegyzés szerkesztése 16 órát tartott. Az eredmények a Székelyföldi diaszpóra interaktív, világtérkép adatvizualizáció, geolokalizált tortadiagramokkal (interaktív – teljes képernyő, statikus). A geolokalizációt a Google Maps Geocoding API és pyegocoder Python bővítőcsomag segítségével hajtottuk végre. A tortadiagramok SVG nyelvben vannak rajzolva, ebben ez a blogbejegyzés is segített. Ugyanez Európa, Amerika, Románia és Székelyföld felbontásában. Európa esetében külön tárgyaltuk Maroshévíz és Balánbánya, Csík-, Gyergyó- és Udvarhelyszék, valamint Háromszék és Marosszék esetét. Elkészítettük továbbá székelyföldi városok migrációs arányairól szóló adatvizualizációt (interaktív – teljes képernyő, statikus), a célországok (interaktív – teljes képernyő, statikus) és Románián belüli célmegyék (interaktív – teljes képernyő, statikus) Sankey folyamatábráját, valamint a Székelyföldi diaszpóra rangsor-méret illetve gyakoriság-méret szabályainak adatinfografikáit. Az elemzés végső elemét a Teljes székelyföldi diaszpóra interaktív adatvizualizációja jelenti (interaktív – teljes képernyő, statikus). Ha tetszett a bejegyzés, vagy bármilyen kérdésed, hozzáfűznivalód van, Like-olj, Oszd meg, Kommentelj, és Iratkozz fel! Ha tetszenek az ehhez  hasonló vizuális adatelemzések, itt támogathatod a blogot.

 
 

Csala Dénes

adatblogger

48 hozzászólás

CSALA Dénes · 2015-08-27 - 22:58

+ 1: a blog látogatói is (többé-kevésbé) követik az eloszlást! – bár kevesebb látogató érkezik Romániából http://s06.flagcounter.com/more/EeG2/

Dobos Istvan · 2015-08-28 - 08:03

Ez egy nagyon izgalmas blog, már alig várom a következő bejegyzést. 🙂

wearelikesnowflakes · 2015-08-28 - 08:54

Haha ez vicces, hogy a látógatóid is követik a statisztikát. Ha nem jött volna le nagyon-nagyon tetszik, amiket itt csinálsz 😛

István Fülöp · 2015-08-28 - 13:05

Ez hatalmas munka, csak gratulálni lehet hozzá.
Ellenben ha Székelyföldrõl beszélünk, az nem a három megye, ezt célszerû szem elõtt tartani. Hogy mettõl meddig van Székelyföld, azt meg lehet találni pl. a Székely Nemzeti Tanács statútum-tervezetében, az sznt.sic.hu oldalon.

    CSALA Dénes · 2015-08-28 - 14:15

    Köszönöm a hozzszólásod! Persze, a bejegyzés végén is külön kiemelem Székelyföld, illetve a három megye közötti lakosságbeli különbséget. A SZÉKELYDATA bejgyzéseiben rendszerint jól meg van határozva Székelyföld határa (Lakosság, Gazdaság, Vallások posztok), és ebben az esetben is csak Szászrégen és Segesvár esne kívül, ám a “határhoz” nagyon közel – ezért foglaltam bele őket az elemzésbe. Persze bekerülhetett volna Bodzaforduló (Székelyföld területén), Dicsőszentmárton vagy Marosludas (mindkettő Maros megyében) is.

      Valér Veres · 2015-08-29 - 14:53

      Én is gratulálok a szerzőnek. Mint népszámlálási adatokat elemző szociológus nagy érdeklődéssel olvastam az elemzést. A tendenciák is jól kirajzolódnak, a migrációs célországok szerint, és az eltérések is, de a legjelentősebb a tk. székelyföldi, és a más maros megyei városok eltérései. Ha tudományos igényűvé szeretné tenni az irást, két módszertani szempontra szeretném felhívni a figyelmet: 1. a facebook-al rendelkezők társadalmi háttere erősen eltérhet a teljes népességtől, ezért az extrapolálás körülményes. Ez azért gond, mert az értelmiségiek nagyobb arányban vándoroltak Magyarországra, míg az alacsony iskolázottságú középkorúak között többen lehetnek más országokban (Olasz, Német, Svájc), akiknek nincs facebook oldaluk.

Tmsh · 2015-08-28 - 13:16

Itt is van hasonló Felsőháromszékről / Kézdívasárhelyről : https://www.kezdi.info/nagyvilag

    CSALA Dénes · 2015-08-28 - 14:41

    Ez valóban nagyszerű 🙂 (amúgy a fenti bányászatban is gyakorlatilag név szerint szerepelnek a találatok – ezért rendkívül egyszerű lenne a világtérképre a neveket és a profil-linkeket is elhelyezni… de persze ezt a keresést magunk is végrehajthatjuk a Graph Seach-ön, miután már tudjuk, hogy mi a célváros: “people from X living in Y” típusú kereséssekkel.)

      Tmsh · 2015-08-28 - 15:23

      A kezdi.info saját fejlesztésű közösségi alkalmazás. Fb vonalon ez valamivel teljesebb lenne. Ha még a quandl.com-t is hozzá tennénk watson-nal együtt akkor már szikrázna 🙂

      (megj. a 2012-s “román” statisztikai adatokat nem tartom reálisnak, Kézdivásárhelyről leven szó esetemben a 18491 kicsit túlzottan optimista megközelítés, de az irányon nem változtat)

      További jó munkát kivánok, csak így tovább Dénes!

magyarinandor · 2015-08-28 - 13:30

Látványos, de teljességgel irreleváns statisztikákból összeállított ábrák és palacsinták …. megtévesztésre is alkalmasak.

    CSALA Dénes · 2015-08-28 - 14:20

    Kedves Nándor, köszönöm a hozzászólásodat! Kérlek fejtsd ki bővebben, hogy miért gondolod, hogy az itt bemutatott adavizualizációk irrelevánsak, illetve “palacsinták”. Természetesen semmi sem tökéletes, de próbáltam a fellépő lyukakat minél jobban betömni, illetve logikusan és részletesen elmagyarázni, hogy az adatokat milyen referenciarendszerben és megszorítások tudatában kell értelmezni. Ezzel együtt úgy gondolom, hogy egy igenis reális és valós kapunk a diaszporáról – hagyományos staisztikai módszerekkel a mai felgyorsult és megnyílt világban sajnos ehhez még csak nagyságrendben sem hasonlítható analízist lehet készíteni. A közösségi médiában rejtőző információból rengeteg sok mindent ki lehet hámozni, ajánlom figyelmedbe a tavalyi, romániai elnökválasztásről szóló bejegyzésemet, ami a közösségi média ott betöltött szerepét vizsgálja.

      magyarinandor · 2015-08-28 - 14:53

      Kedves Dénes, engedd meg, h nagyon röviden, lényegében a blikkfangos címre utaljak, ami fölöttébb félrevezető. Semmi értelme a “teljes diaszpóráról” beszélni, amikor csak a fb profillal rendelkező, azok közül is, csak a születési és lakóhelyet megadó, székelyföldi városból (ha ugyan Segesvár Székelyföld), valamint Parajdról (az község) való személyek adatai kerülnek bele a statisztikákba. Az adataid irrelevánsak, mert semmilyen vonatkozásban nincsenek kontrollálva, sem etnikailag (mégis székely(földi)ekről szólsz), sem település-típus szerint, sem azt nem tudjuk végleg vagy időszakosan tartózkodnak ott, ahol, sőt azt sem, hogy valóban ott vannak-e, amit föltűntetnek! Csak egy példa – olvasóid máris érces megjegyzéseket tesznek az adat kapcsán – akik Kolozsváron jártak/járnak egyetemre, pl., azokról úgy tűnik, h. ide is költöztek! Innentől pedig az egész játék látványos,de irreleváns statisztikákkal.

      CSALA Dénes · 2015-08-28 - 16:17

      Kedves Nándor, több általad felhozott hiányosságra már magában a bejegyzésben én magam is felhívtam a figyelmet. Ugyanakkor megpróbáltam a rendelkezésre álló adatok függvényében a legjobbat kihozni ebből. A városok kiválasztását illetően máris többen megkerestek, hogy miért van vagy nincs benne egyik vagy másik település. Előre is elnézést kérek mindazoktól, akik nem fértek bele – az erőforrásaim és időm is véges 🙂 De majd ha több időm lesz talán újra elvégzem az adatbányászatot, más városokkal is! U.I. Parajd valóban község, de lélekszámra nagyobb mint például Szentegyháza vagy Balánbánya – persze ugyanígy Korond, Gyergyócsomafalva is bekerülhetet volna és Tusnádfürdő meg miért nem, ha város… Tekintsük ezt egy első, csak a legnagyobb településekkel foglalkozó elemzésnek, és a jövőben – főleg ha van igény rá – elkészítem a kisebb települések adatanalízisét is. Ez viszont nem fog merőben változtatni a nagy városok által meghatározott hangulaton. Tudom, hogy ez nem hagyományos szociológiai eszközöket tartalmazó elemzés, inkább a most felemelkedő Computational Social Science témakörébe férne be – azaz a közösségi média-bányászatban levő tudást és irdatlan információmennyiséget az adattudósok és szocilogósuk együttesen értelmezzük és akár közösen javítsunk rajta.. A cím “blikkfangosságát” illetően: ez egy blog, ha megnézzed a többi címnél még ennél is epésebb szövegkonstrukciók voltak terítéken 🙂

István Orbán · 2015-08-28 - 13:33

Én nem kerültem rá a térképre (udvarhelyi Szingapúrban), mert nincs facebookom. Ismerek egy szentgyörgyit is aki itt van, nem tudom az ő profiljával mi a helyzet. Mindenesetre nagyon érdekes, szép munka!

    CSALA Dénes · 2015-08-28 - 14:22

    Köszönöm a hozzászólást! Ha nincs Facebookod – vagy nem publikus a tartózkodási helyed, akkor nem lehetsz rajta 🙂 A bejegyzés végén említem, hogy az adatok teljes lakosságra való skálázásnál az eddigi egy-két személyt számláló települések felduzzadnak, holott a valóságban valószínűleg több ilyen létezik, szétszórva a világ minden táján, mint például Szingapúr 🙂

      István Orbán · 2015-08-28 - 16:15

      Utánajártam: a szentgyörgyi ismerősöm születési helye és tartózkodási helye sem publikus, úgyhogy érthető. Már csak egy kérdés maradt: mit keresnek a barótiak Indiában?

      CSALA Dénes · 2015-08-28 - 16:22

      Ez nekem is annyira kilógott a sorból, hogy többször is újranéztem, de nem tűnik hibának 🙂

      CSALA Dénes · 2015-08-28 - 16:27

      Az történik, hogy pl. ehhez a profilhoz hasonlóan talán más indiaiak is a kovásznai Barótot jelölték be születési helyül. Egy elírási figyelmetlenségből egy másik, valószínűleg hasonló kiejtésű, Észak-Indiai településre gondoltak – akárcsak a székelyföldi kis települések neve is sokféleképpen szerepel a Facebookon. Ezeknek a hibáknak a feltérképezése fizikailag lehetetlen, ám az emberek szerencsére elenyésző számban vannak. Remélem ez segít.

Kovács J. Szilamér · 2015-08-28 - 13:59

Hát ez a 34 ezer székely Kolozsváron egy nagyon fájdalmas szám, komoly veszteség Székelyföld számára. Sajnos a magyar pártoknak semmi stratégiájuk nincs a székelyek kimentésére… ezért írtam egyszer, amennyiben a háromszékiek hazajönnek Kolozsvárról Kolozsvár imploziót szenved, ha az összes székely haza jön össze is dől. Úri luxus egy ekkora kihelyezett székely várost fenntartani, rengeteg székely utánpótlást kell kiküldeni, hogy a tanároknak diákjaik legyenek.

    Szabadi Tamás · 2015-08-31 - 15:53

    Székelyként magam is Kolozsváron jártam egyeteme, de akkoriban NEM lehetett Kolozsváron maradni az egyetem befejezése után. Ma viszont lehet. Akár informatikus vagy, akár közgazdász (hogy csak két példát mondjak) sokkal könnyebb munkát kapni Kolozsváron, mint mondjuk Kézdivásárhelyen vagy Gyergyóban. Arról nem is beszélve, hogy fiataljaink (beleértve az én gyerekem is) sokkal jobban kedvelik Kolozsvár pezsgő életét, mint valamelyik unalmas kisvárost, vagy nagyközséget, ahonnan származnak. És nem lehet nekik megtiltani, hogy K-váron maradjanak. Még mindig jobb annál, mintha Ausztráliába mennek vagy csak közelebb Spanyolországba, vagy csak ide ehelyt Debrecenbe v. Szögedre. De ezt sem lehet nekik megtiltani. Ez a tanulmány vagy informális felmérés is ezt igazolja.
    Ami a fiataljank taníttatását illeti idézet “hogy a tanároknak diákjaik legyenek”, azt úgy kell felfogni, hogy mindenki olyan egyetemet/szakot választ amilyent akar, s ha potyára járt egyetemre (hiábavaló szakot végez), akkor ez az ő választása és döntése volt (Ő kereste magának.) Ha olyan szakot választ, amivel jól keres és jól boldogul (még ha kicsit nehezebb szak is) akkor azért pedig ő dolgozott meg. Mi annyit segíthetünk nekik, hogy esetleg tanácsokat, ötleteket adunk, de ŐK DÖNTSÉK EL. S ki milyen virágot választ/szakít, olyant fog szagolni. (Ezt mondani szokták a párválasztásra is, nem csak a szakma megválasztására.) Én ma is szeretem Kolozsvárt és elmegyek színházba, koncerte, az egyetemekre, de még tursitaként is, ha időm és módom van rá.

CSALA Dénes · 2015-08-28 - 15:47

Előre is elnézést kérek a Tusnádfürdőiektől és Borszékiaktól – meg minden más településtől aki részletesen szerette volna magát itt felfedezni – sajnos az idő és erőforrások szűke miatt most csak ennyire nyílt lehetőség. Amint lesz időm, újra lefuttatom az algoritmust más településekre is – főleg ha sokan kéritek 🙂

Márton Benyó · 2015-08-28 - 20:10

ez fantasztikus munka, gyönyörű! Csak gratulálni tudok!

Gyevad · 2015-08-28 - 23:29

Csak az első térképet néztem meg, hogy honnan hova hányan vándoroltak ki, és ott is csak a környékembeli falvakat, egy kis helyesbítést küldenék a készítőknek
Diakovce magyarul: Deáki
Velké Úlany magyarul: Nagyfödémes
Trnava magyarul: Nagyszombat
Surany magyarul: Surány
Sahy magyarul: Ipolyság
És kicsit fura, mert Deáki alatt van egy pötty, ami szerint ott Csíkszereda található, és Gyergyószentmiklósról van ott valaki.
Nem néztem át az összes falut és várost, mert akadozott eléggé, de ha a készítők szeretnék magyarosítani a szlovákiai magyar településeket, akkor a Szlovákiai magyar adatbank településlistáján megtalálnak mindent 🙂
http://adatbank.sk/telepulesek/szlovakia-telepuleseinek-listaja/

Szép munka, további jó munkát hozzá!

    CSALA Dénes · 2015-08-29 - 00:35

    Köszi szépen a hozzászólást – most csak nagyon kevés település magyarosítására volt időm – mert ezt manuálisan végeztem – de mindenképpen köszönöm és a jövőben figyelembe veszem az ajánlott adatbankot! Az ominózus Csíkszereda geokódolási hiba, mert egy felhasználó azt jelölte meg lakhelynek, hogy Szereda, Trnavský, Slovakia. Ez Felső Szeli településre kódolódik. Ezt és az említett szlovák települések neveit javítottam.

Kollár Csaba · 2015-08-29 - 01:02

Kedves Dénes! Ugyan tökéletes kutatás nincs, de amit, s ahogy csináltál, az értékes, szakmailag kiváló. Gratulálok hozzá! Csak most akadtam az oldaladra, s így gyorsan meg is kérdezem: big datával hivatásszerűen is foglalkozol?

    CSALA Dénes · 2015-08-29 - 02:18

    Kedves Csaba, köszönöm a hozzászólásod! Igen, hivatásszerűen data science-el és dinamkius rendszerek számítógépes modellézésvel foglalkozom.

magyarinandor · 2015-08-29 - 07:59

Kicsit összegezve. Az adatok, a látványos táblák, ábrák, torták (úgy is mint palacsinták), grafikonok, stb. jó esetben is illusztrációk, ahhoz, hogy az adatbányászást futtató számítógépes alkalmazás mire képes. Ennyi és nem több.
Az adatok nem mutatják meg a Székelyföldről való elvándorlás valós térképét/helyzetét, méreteit, irányultságát, stb., magyarán a migráció szociológiai szempontjai szerint érdektelenek.inkonzisztensek és irrelevánsak.
Ezért a cím (beleértve az egyes táblák címeit is) megtévesztő (ezen csak ront, ha máskor is ilyen félrevezető címek alatt jelentek meg “statisztikai elemzések” – valaki máris ebből a megtévelyedettségből, az adatok félreértéséből fogalmaz meg éles Kolozsvárellenes kirohanást).
Végül, de nem utolsó sorban, nem lenne érdektelen egy újabb bejegyzéssel korrigálni azt, ami félreértést okozhat és ismét kiemelni: az adatok csak azokra vonatkoznk, akiknek van fb profilja és ott születési helyet, valamint lakhelyet föltűntetett; nem tudjuk, hogy a föltüntetett tartózkodási hely állandó lakóhely, ideiglenes, vagy csak pillanatnyi (ez, Kvár esetében egészen biztos, h nem állandó lakhelyre vonatkozik);a települések véletlenszerűen lettek kiválasztva, nem tükrözik a Székelyföld (amúgy vitatható határokkal rendelkező régió) lakóhelyi szerkezetét, urbánus/rurális arányait, csak egyes városokra, illetve egy nagyobb községre vannak adatok; nem ismert, illetve nem lett figyelembe véve az adatokban szereplők etnikai identitása, ezért végső soron, nem csak “székelyekből” állhat a sokaság, amelyre az adatok vonatkoznak.

    CSALA Dénes · 2015-08-29 - 13:01

    Kedves Nándor, ehhez én még csak annyt fűznék, hozzá, hogy a bejegyzésben következetesen “székelyföldiekről” beszélek és nem székelyekről. Akarattal nem hoztam be az etnikai leosztást, mert nem akarok ezen a téren senkivel sem vitába keveredni – bár úgy néz ki ez mégsem sikerült. Ha figyelmesen olvasod, a bejegyzés során legalább háromszor ki van emelve és emellett részletesen elmagyarázva és levezetve, hogy mi a bányászott minta háttere. Az ott-tartózkodás idejét lehetetlen Facebookról megszerezni – de nem is kell, mert ahogy a régi diákok elhagyják a várost, jönnek újak, ezért az ottanik száma pszeudokonstans. A kommented legelejéhez sajnos nem tudok hozzászólni, ám ajánlom figyelmedbe David McCandless – Information is Beautiful és Knowledge is Beautiful című könyveit, illetve online publikációit – ezekben el van magyarázva az emberek kognitív értése mögötti tudomány, és az, hogy miért nem működnek a táblázatban felsorolt nyers adatreprezentációs formák – gyakorlatilag az egész adatvizualizációs tudomány ars poeticaja.

Valér Veres · 2015-08-29 - 15:05

Én is gratulálok a szerzőnek. Mint népszámlálási adatokat elemző szociológus nagy érdeklődéssel olvastam az elemzést. Egyes, ismert tendenciák is jól kirajzolódnak, a migrációs célországok szerint, és az eltérések is, de a legjelentősebb a tk. székelyföldi, és a más maros megyei városok eltérései. Ha tudományos igényűvé szeretnéd tenni az irást, két módszertani szempontra szeretném felhívni a figyelmet: 1. a facebook-al rendelkezők társadalmi háttere erősen eltérhet a teljes népességtől, ezért az extrapolálás körülményes. Ez azért gond, mert az értelmiségiek nagyobb arányban vándoroltak Magyarországra, míg az alacsony iskolázottságú középkorúak között többen lehetnek más országokban (Olasz, Német, Svájc), akiknek nincs facebook oldaluk.

    CSALA Dénes · 2015-08-30 - 06:35

    Kedves Valér, örvendek hogy szociólógusokhoz is eljutott a munkám. Én sajnos ehhez a szkmához nem értek, ezért nagyon köszönöm a hozzászólasod és persze teljes mértékben igazad van. Ami a Facebook oldalról még hozzá tudok tenni az az, hogy aki megadja, hogy mi a jelenlegi munkahelye, akkor azt is feltréképezem, hogy közelebb kerüljön a valós képhez – ahogy írtad!

Dániel Botond · 2015-08-29 - 19:57

Kedves Dénes,

Először is gratulálok a munkáidhoz. Nagyon izgalmas a big data-val való találkozás, a témák is érdekesek, amelyekkel foglalkozol (Csíksomlyó, menekültek, migráció stb.), és rengeteg izgalmas elemzési móddal találkozok. Szociológusként csatlakoznék Magyari Nándor és Veres Valér aggodalmaihoz, illetve javaslataihoz.

Szerintem is érdemes lenne következetesebben kiválasztani a vizsgált településeket (pl. csak a városokat, vagy egy adott lélekszám fölötti településeket), ez tisztábbá tenné az elemzést. Ez viszont szerintem egy viszonylag egyszerű kérdés, amit bármikor korrigálni lehet (kivenni egy-két települést, vagy adatokat gyűjteni néhány másikról).

A bányászott adatok nagyon izgalmasak és rengeteget lehet ötletelni róluk. Az általánosítás viszont szerintem már problémásabb. Egyrészt azért, amit már mások is említettek (csak a facebook profillal rendelkezőkről van adat és közülük is csak azokról, akik publikusan megadták a születési és tartózkodási helyüket, a tartózkodás időtartamáról és céljáról sincs információnk), de egy másik ok miatt is:

Azt hiszem, hogy akkor, amikor a bányászott adatokat arányítani akarjuk a települések lélekszámához, akkor egy elég komoly hiba becsúszik. Például az, hogy akik már 2011 vagy akár 2002 előtt kivándoroltak, azok igazából nem a népszámlálások alkalmával mért lakosságból vándoroltak ki. Azok a székelyföldiek, akik a kilencvenes évek közepén vándoroltak ki Magyarországra (sajnos nem tudok erről én adatokat mondani, de Veres Valér biztos igen), azok ezekben az adatokban úgy jelennek meg, mint Székelyföldön született, Magyarországon élő személyek. (Valószínű, hogy a középkorúak között felül vannak reprezentálva) Ahhoz, hogy reálisabb képünk legyen, őket mind ki kellene vonni a migránsokból, amikor azt vizsgáljuk, hogy a jelenlegi lakosság (itthon regisztrált lakosság) hány százaléka él itthon és hány százaléka külföldön. Azok a személyek, akik már régebb kitelepedtek felfelé torzítják az arányokat. Ha a jelenlegi elemzés azt mondja, hogy 22 százalék (a legutóbbi népszámlálási adatokhoz viszonyítva) körüli azok aránya, akik az ország határain kívül élnek, akkor ez az arány alacsonyabb kell legyen.

Summa summarum, két fontos szempontot szerintem még figyelembe kellene venni:
1. Nagyon fontos lenne különválasztani a migráció időtartamát: az időszakos migrációt – tanulás, munkavállalás stb. céllal, és már lezárult migrációt – kitelepedést – ezt gondolom a facebook adatok alapján szinte lehetetlen különválasztani. Szerintem ennek a két jelenségnek az összemosódása nagyon zavarja az eredményeket!
2. Másik szempont, hogy érdemes lenne korosztályos bontásban elvégezni az elemzéseket, mert így valamivel közelebb kerülünk a valósághoz. Sokkal reálisabb lenne szerintem, ha megnéznénk külön a 18-24 éves vagy 25-34 éves korosztály migrációját (ami valószínűbb, hogy ideiglenes) és a 35-44 éves korosztályt vagy 45 évnél idősebbeket, akik valószínű, hogy nagyobbrészt már nem migránsok, hanem “elszármazottak”. (a facebook statisztikák ezekkel a korcsoportokkal dolgoznak, ezért gondoltam ezekre)

(Kolozsvár viszonylatában is érdekes lenne megnézni, hogy igazából milyen korosztályokról van szó, szerintem az izgalmasabb itt is a 25 év fölöttiek, akik egyetem után ottmaradnak. A 18-24 évesek közül egy bizonyos arány utána hazatér, külföldön keres munkát stb.)

További jó munkát kívánok, és örülök, hogy van lehetőség arra, hogy vitázzunk az adatokról, módszerekről, elemzésekről.

    Dániel Botond · 2015-08-29 - 20:16

    Egyszerűen fogalmazva, amit mondani szeretnék:
    Ha Gyergyószentmiklóson 18.377 személy él (van regisztrálva) a 2011-es népszámlálás szerint és 20.018 személy élt (volt regisztrálva) 2002-ben, akkor a facebook adataiból nem tudhatjuk, hogy mondjuk a jelenleg Magyarországon megtalált 302 személy közül hány személyt kell igazából az arányítás során a jelenlegi lakosságszámhoz arányítani (a 18.377-hez), és hány személy van közülük, aki igazából ahhoz az 1641-hez kell számolni, aki 2002-2011 között elvándorolt (nem beszélve azokról, akik már 2002 előtt elvándoroltak), és statisztikailag nincs köze a jelenlegi lakossághoz.

    Ezért nem mondhatjuk, hogy Gyergyószentmiklós lakosságának x százaléka él Magyarországon. Vagy Székelyföld lakosságának x százaléka él külföldön.

    Az továbbra is nagyon izgalmas, hogy tudjuk, hogy legalább 302 gyergyószentmiklósi születésű személy él jelenleg Magyarországon, vagy legalább 51-en az Egyesült Királyságban.

      CSALA Dénes · 2015-08-30 - 06:42

      Persze, ezt meg is jegyeztem, hogy az adatok dinamikáját nem tudhatjuk, oda muszáj folyamatmodellt építeni.

    CSALA Dénes · 2015-08-30 - 06:41

    Kedves Botond! Köszönöm a hozzászólásod – egyetértek veled. Mivel sajnos ez a blog jelenleg teljesen hobbiszinten működik akkora granularitásra, amit javasolsz teljes állásban végzés nélkül jelenleg nincs lehetőségem. Ám: ha neked mint szociológusnak bárhogy hasznosak a bányászott adatok, szívesen megosztom, sőt újakat is lefuttathatok!

Hangai Botond · 2015-08-30 - 07:28

Lelkes és eredményes munka, remélem a nemzetünk hasznára fordítható. Ha ismerjuk és tudjuk a merre járunk honnan kell hazatalálni, nem csak fizikálisan, nagyon eredményes lehet. Sokunk tenne is a szulőföd megmaradásáért. Nem kell valaki mástól várni a szabadság kegyeit.

Musai de View · 2015-08-30 - 20:18

és mire jó tudni hova mentek a nemzetárulók?

Kapitány Balázs · 2015-08-31 - 09:53

Kedves Dénes!
Szerintem előremutatóbb, ha az közösségi médiában történő adatbányászatra és az adatvizualizációra nem a szociológiától független vagy azzal szemben álló tudományként tekintenénk, hanem úgy, mint segédtudományokra. Ahogy a történészek számára segédtudomány pl. az oklevéltan, vagy a régészet, úgy lehetne (és remélem lesz is majd) pl. az adatbányászat vagy az adatvizualizáció a szociológia / közgazdaságtan stb. együttműködő partnere.
Ez a migrációs összeállítás szerintem pl. nem “palacsinta”, hanem egyáltalán nincs messze attól, hogy a klasszikus szociológiai tudományos sztenderdeknek is megfelelő legyen. Ahhoz, hogy ez egy korrekt statisztikai becsléssé alakulhasson, szerintem három kiegészítő információt kellene tudni és becsatornázni a becslésbe. Fontossági sorrendben:
– A Veres Valér és mások által felvetett probléma: a Facebook használók társadalmi profilja mennyire tér el a teljes alapsokaságétól (3 megyében születettek). Ha egy szokásos, a 3 székely megyére reprezentatív kérdőíves lekérdezésbe beteszünk egy facebook használatra vonatkozó kérdést, (jó eséllyel van is ilyen adat, mert a politikai közvélemény-kutatásokban erre – más okból – rá szoktak kérdezni) akkor az az alapján pl. nem, korcsoport és iskolai végzettség szerint valamennyire megbecsülhető, hogy egy adott csoport mekkora aránya facebook használó. Ennek ismeretében már valamennyire besúlyozható a bányászott adatbázis.
– Fontos lenne tudni, vajon mennyire pontosak a megadott születési hely adatok. Csehországban ezt tudtommal nézték, és az derült ki, hogy a községekben születők csaknem fele facebookon azt a települést adta meg, ahol a kórház volt, ahol megszületett, míg a másik fele azt a települést, ahol szülei valójában laktak, amikor megszületett. Ez azért kulcskérdés, mert ha ez igaz Erdélyben is, akkor a kórházzal, szülészettel rendelkező települések kivándorlási számait (ezek a városok) rettentően túlbecsülöd. Ez a probléma kiküszöbölhető lenne, ha egy terület összes települését legyűjtenéd, és aggregálva közölnéd, mert akkor már mindegy lenne, hogy pl. a Gyergyóditrói Szentmiklóst vagy Ditrót adta meg születési helyként.
– Végül felmerül, hogy jó lenne azért tudni, mennyire pontos, mennyire frissítik az emberek a tartózkodási helyet a profiljukon. Tapasztalataim szerint a facebook profilok jó része (talán több mint a fele), valójában ’tetszhalott’, kérdés, hogy ezen profilok esetén mennyire pontos a hely, illetve nem-e kivándorlás előtt állapotot rögzít.

    CSALA Dénes · 2015-09-01 - 00:36

    Kedves Balázs! Örvendek, hogy hozzád is eljutott a bejegyzésem. Ahogy írod, én is inkább azt szorgalmaznám, hogy közös projekteket alakítsunk ki szociológusokkal – vagy más társadalomkutatókkal – együttműködve. Az általad felhozott három ponttal merőben egyetértek, és amennyiben pl. ez a bejegyzés tovább fejlesztődik egy támogatott és bővített, valós projektté, akkor ezeket a lépéseket kétségkívül meg kellene tenni – és az anyagi és emberi erőforrások adottságában ez szerintem nem is jelentene olyan jelentős problémát – mindhárom kérdésre a válasz hagyományos (fizikai vagy digitális) kérdőíves módszerekkel legalább hozzávetőlegesen betájolható. Talán az egyik leghasznosabb munka a bányászat oldalról az adatok dinamikájának tanulmányozása lenne, azaz megfigyelni az eloszlást mondjuk havonta egy éven keresztül.

Arnold Platon · 2015-09-22 - 11:13

Nagyon-nagyon érdekes blogposzt. Az egyetlen dolog ami ugy éreztem hogy hiányzott az egy “percent stacked bar chart” az országos adatokkal. A Sankey diagram elötti térkepben, amelykben “pie chart”-okat használtál, egy kicsit nehéz a disztribuciot megbecsülni.

    CSALA Dénes · 2015-09-22 - 13:54

    Köszi Arnold! Igen, az valóban jó lett volna – bár gondoltam a Sankey majdnem ugyanazt az információt hordozza.

      Arnold Platon · 2015-09-22 - 14:40

      Nem épp. Például szeretnőm látni hogy Franciországba, Spanyolországba és Németbe hogy van a városok distribucioja. Például látszana hogy Spanyolba sokkal tőbb Balabányai van mint máshól. A pie chat-ok nem olyan jók mikor több mint 3-4 categoria van, de neked 16 van.

      Arnold Platon · 2015-09-23 - 11:40

      Valami ilyesmire gondoltam: http://i.imgur.com/TyGpkR1.png

Hol vagytok, székelyek? | Élő Székelyföld · 2015-08-29 - 16:13

[…] a mai Maros, Hargita és Kovászna megyében élőket és az onnan eltávozottakat. Jó tudni erről a […]

Anya gyermekével | Élő Székelyföld · 2015-12-20 - 09:35

[…] közelmúltban Csala Dénes végzett egy kutatást ide vonatkozóan. Az eredmény fölöttébb elgondolkodtató. Ez a kutatás […]

Mitől halunk meg? – Globális Elhalálozási Időfolyam | SZÉKELYDATA · 2016-01-26 - 12:03

[…] 2015-ben megszámoltuk, hogy hányan jöttek el a csíksomlyói búcsúra és azt is elkezdtük feltérképezni, hogy honnan – azaz pontosabban, hogy hol élnek az elszármazottak a nagyvilágban. Tudjuk […]

I’m back + Régiósítás Székelydata módra | SZÉKELYDATA BACKUP · 2017-01-14 - 06:40

[…] egyik nagy erőfeszítés jelenleg a Hol vagyok székelyek – Székelyföldi Diaszpóra projekt továbbvitele – foglalkozások, képzettség, iskolázottság és más demográfiai […]

I’m back + Régiósítás Székelydata módra | SZÉKELYDATA · 2017-01-14 - 07:03

[…] egyik nagy erőfeszítés jelenleg a Hol vagyok székelyek – Székelyföldi Diaszpóra projekt továbbvitele – foglalkozások, képzettség, iskolázottság és más demográfiai […]

Romániai és Magyarországi repülőtérkép | SZÉKELYDATA · 2017-03-19 - 21:03

[…] repülőtereinek heti járatszámait vizsgáljuk. Így közvetetten ez a bejegyzés a Székelyföldi diaszpóra elemzéshez […]

Leave a Reply to CSALA Dénes Cancel reply