Való igaz, hogy 2016-ban  elég gyenge volt a felhozatal új Székelydata bejegyzések terén. Ennek persze több oka is van, ez még mindig egy egyemberes projekt és a tavalyi év számomra országváltást, PhD megvédést, esküvő(ke)t rejtegetett. Ellenben úgy gondolom, hogy ez a helyzet mégiscsak tarthatatlan, mondhatni zabba mentek a lovak – és már jól a mező közepén járnak – eljött az ideje, hogy visszavegyem a gyeplőt kezembe.

Előszöris azzal kezdeném, hogy, megosztom veletek végtelen hálám és köszönetem, hiszen a bejegyzések hiátusa ellenére 2016-ban is több, mint 10 000-en látogattátok meg a blogot. Az igazat megvallva, nem csak időhiány miatt nem születtek bejegyzések, hanem komoly motivációs problémákkal is küzdöttem a tavalyi évben. Úgy éreztem, hogy a “nagy témákat” már elsütöttem, nem tudtam mit lehetne még kihozni egy ilyen blogból. 2014-ben ez még szuperújdonságnak számított, ma már vannak hasonló kezdeményezések. Munkám elsodort az adatvizualizáció direkt alkalmazásától és sokszor gondolkodtam az egész projekt értelmén, milyenségén és minőségén.  Sok ötlet jutott eszembe de nem tudtam rávenni magam, hogy megvalósítsam őket, vagy pedig félbeszakadtak az adatok begyűjtése, feldolgozása után. Ellenben a médiát pásztázva, kiváltképp globális, de ugyanúgy lokális, magyar, erdélyi és székelyföldi téren, 2017-ben még mindig úgy érzem, hogy szükség van egy Székelydata-szerű, politikailag független, információalapú közlésfelületre. Az angol nyelvű blogomon ezt dataktivizmusnak hívom. Amint a világ egyre jobban felgyorsul, az emberek egyre kevesebb időt tudnak fordítani egységnyi hírekre, hírfoszlányokra. Így történhetnek meg olyan dolgok, mint a Brexit vagy Trump – vagy éppen a PSD újabb nyeresége – amikor az emberek nem néznek a klikkvadász cím, egyszerű cikk, fekete-fehér üzenet mögé, egyszerűen készpénznek veszik azt. A vizuális információ azonban 7-8-szor sűrűbb, mint a szövegalapú közlés, az agyunk a képeket sokkal gyorsabban fel tudja dolgozni, mint a szöveget. Ezért ebben a gyors világban talán kiváltképp fontos, hogy a nagy információsűrűségű közlési csatornákat fejlesszük, ápoljuk és támogassuk.

Az utóbbi két évben jelentős számú projektfoszlány születetett, egyet alább, ebben a bejegyzésben részletesen is bemutatok – volt amelyikük eljutott a vizualizációig, de sokuk még csak az adatgyűjtésen sem esett át. Ellenben itt szeretném azt közzétenni, hogy arra jutottam, megváltoztatom a publikálási stratégiámat: a világ egyik legnépszerűbb adatvizualizációs guruja, az általam is nagyra becsült és mélyen tisztelt Nadieh Bremer – a.k.a. visualcinnamon – és társa Shirley Wu közös ötlete alapján, havonta egy új adavizualizációt fogok közzétenni. Igaz, hogy a megszokottnál rövidebb lesz, de minden héten lesz új bejegyzés, pénteken: az első két héten az új projektötletről és az adatokról kaptok ízelítőt, bemutatom felkutatásuk és feldolgozásuk menetét, illetve a hozzájuk illő, szóba jöhető megjelenítési formákat és technikákat. A harmadik héten a kód struktúrájával és az adatok normalizásával foglak szórakoztatni, míg a negyedik héten jön majd a végső adatvizualizáció és leírás. Ezáltal nemcsak egy rendszerességet szeretnék bevezetni a blogon, hanem az adat → információ → tudás folyamatot is szeretném kifejezetebbé tenni (az érdeklődőknek itt van egy interaktív diasorozatom erről)

Szeretnélek továbbá tájékoztatni a folyamatban levő, félkész vagy alvó Székelydata projetekről:

  1. Az egyik nagy erőfeszítés jelenleg a Hol vagyok székelyek – Székelyföldi Diaszpóra projekt továbbvitele – foglalkozások, képzettség, iskolázottság és más demográfiai adatok bekebelezésével. Ez időközben szerves része lett a Digitális Székelyföld kezdeményezésnek és javában folyik a kvantitatív és kvalitatív adatok gyűjtése, feldolgozása. Ha nem külföldön laksz, akkor te is hozzájárulhatsz egy picivel, e rövid kérdőív kitöltésével. Erről a projektről Decemberben, Székelyudvarhelyen tartottam egy rövid beszámolót – innen is van egy interaktív prezentáció. Jelenleg a legnagyobb kihívást az adatok normalizálása és klaszterezése jelenti, ezen a téren majd valószínűleg hozzátok fogok fordulni, és egy újabb székelyföldi digitális kaláka-crowdsourcing projekt keretében majd együtt felcímkézünk és kategóriákba sorolunk nehány ezer foglalkozást, képesítést, egyetemet és iskolát 🙂
  2. A tavaly februári digitális kalákára a székelyföldiek egy napjáról 253 válasz érkezett – ezek feldolgozása lesz az első idei projekt, február 10-én jön az első rész, az adatokról.
  3. Folyamatosan foglalkoztat a SZF2030 dinamikus modell fejlesztése, 2017 lesz az az év amikor az alapköveket ide is lerakjuk.
  4. Tervben van a meglevő bejegyzések frissítése, napirendre való hozása újabb adatok feltöltésével. Egy viszonylag egyszerűen oldható meg a gazdaság, lakosság, vallás és bérszakadék bejegyzéseknél. Ezért egy hónapot majd a frissítéseknek dedikálunk.
  5. Ugyanakkor már több, mint egy éve ígértem nektek bejegyzést a székelyöldi klímaváltozásról – itt az adatokhoz való hozzáférés keményebb diónak mutatkozott, mint gondoltam, de itt is van előrelépés és remélhetőleg még az idén megszületik a bejegyzés.
  6. Az idei nagy projektem egy adatelemzés elkésztése a Székelyföldi Mezőgazdaságról. Itt az a tervem, hogy nem csak az adattudományt hívom segítségül, hanem titeket, és közvetlenül-közvetve a székelyföldi gazdákat, bácsikat, néniket is – hogy rögzítsük, milyen tájon, melyik években volt jó a termés, milyen terményekkel, műtrágyákkal, munkamenettel. A Székelydata három nyári hónapját szeretném erre a projektre áldozni 2017-ben – erről még lesz szó bővebben is hamarosan!
  7. 2018-ra térve még egy másik nagyobb projekt is motoszkál a fejemben, mégpedig egy automatizált  testvérrégió-felismerő program elkészítése, többdimenziós adatbányászattal. Az ötlet gazdája Antal Árpád és röviden arról, szol, hogy térképezzük fel a világ többi olyan régióját, ami földrajzilag, demográfiailag, gazdaságilag hasonlít Székelyföldhöz.

Köszönöm neked, aki 2017-ben is Székelydatát olvasol, iratkozz fel a frissitésekre az oldal alján és ha tetszik a munkám, akkor fontolj meg egy apróbb adományt PayPal-on.

Dénes


+ bónusz: most pedig jöjjön egy eddig nem publikált, félben hagyott projekt:

Régiósítás Székelydata módra

Erdély régiói automatikus Voronoj-felosztás után, település-előtagok alapján

Ezen a térképen Erdély régióit láthatjuk, Székelydata szerinti felosztásban. Az erdélyi települések magyar neveit felbontottuk és csoportosítottuk az előtagjaik alapján. Az erdélyi magyar névadási hagyomány szerint ezek általában egy folyót vagy hegységet jelölnek (temes, maros, aranyos, görgény, …), ezt követi a település funkciója (vár, vásárhely, udvarhely, …). A csoportosítás után elkülönítettük azokat a településeket, amelyeknek az előtagja legalább három település nevében szerepel – így kaptuk meg a “régiók” halmazát. Ezután ezek a települések köré Voronoj-cellákat rajzoltunk és az így kapott sokszögeket az előtagok alapján készített színkódrendszer szerint festettük ki. Így egy érdekes térkép rajzolódik ki, a folyók folyása és a hegységek mentén, és a szemünk előtt Erdély automatikusan építőelemeire bomlik. 3-400 évvel ezelőtt, amikor Erdély vitathatóan az aranykorát élte, egy hasonló felosztású közigazgatási rendszerben látták a jövőt – talán ebből mai honatyáink is tanulhatnának valamit. Így a globalizáció fénykorának végén, amikor a nemzetállamok újra erősödőben vannak, talán többször kellene megállnunk és visszatekintenünk – hiszen a történelem könnyen megismételheti önmagát és újra eljöhet a városállamok, de legalábbis a kis régiók ideje – amikor a szoros együttműködéssel és koordinálással, együtt fellépő kisrégiók majd szembe tudnak szállni a központosított hatalommal. Külön nem 🙂

Befejezésül csatolom az statikus verziót is:

Erdély régiói


ADATOK + KÓD: A bejegyzéshez felhasznált adatok a Szabó M. Attila Erdély Magyar Helységnévtárában találhatók meg. A vizualizációk d3.js felhasználásával készültek. Az eredmények Erdély régiói automatikus Voronoj-felosztás után, település-előtagok alapján statikus és interkatív infografikák. Ha tetszett a bejegyzés, vagy bármilyen kérdésed, hozzáfűznivalód van, Like-olj, Oszd meg, Kommentelj, Támogass és Iratkozz fel!

 
 

Csala Dénes

adatblogger

1 hozzászólás

GitHub, Patreon és egyéb újdonságok + Erdők sneak peak – SZÉKELYDATA · 2017-04-28 - 06:03

[…] nagy lendülettel vágtunk neki – és az elmúlt időszakban történt jónéhány […]

Leave a Reply to GitHub, Patreon és egyéb újdonságok + Erdők sneak peak – SZÉKELYDATA Cancel reply