| Transkript | |
|---|---|
|
00:00 – 0:00:02
*Musik*
|
|
|
0:00:02 – 0:00:31
[Musik]
|
|
|
0:00:31 – 0:00:39
Hallo und willkommen zu einer neuen Ausgabe der Abspalfung, da wo ich gelegentlich eigentlich
|
|
|
0:00:39 – 0:00:47
fast nie vom Thema abspalfe, es sei denn ich spalfe tatsächlich mal ab. Ich bin Sascha
|
|
|
0:00:47 – 0:00:56
Machmann und sage Hallo. Das heutige Thema ist warum ich fünf Euro von der Bundesregierung
|
|
|
0:00:56 – 0:01:06
bekommen habe. Da geht man mal nichts an zum Briefkasten und schaut nach der Post und dann
|
|
|
0:01:06 – 0:01:15
findet man einen Brief von einer Institution, die an der Bundesregierung angeschlossen ist.
|
|
|
0:01:15 – 0:01:25
Man macht das Ding auf und findet da drinnen einen Brief, dass man ausgewählt wurde von einem
|
|
|
0:01:25 – 0:01:35
ganzen Haufen Leute in meinem Stadtteil und als kleines Dankeschön hätte man ein kleines
|
|
|
0:01:35 – 0:01:43
Geschenk mit dabei gepackt und da war ein kleiner Umschlag drin und da stand quasi drauf
|
|
|
0:01:43 – 0:01:52
"Danke schön" und so ein Geschenk, ein Pikogramm eines Geschenks, heute würde man sagen Emoji
|
|
|
0:01:52 – 0:01:59
eines Geschenks. Ich habe das aufgemacht und da waren tatsächlich so richtig alte,
|
|
|
0:01:59 – 0:02:09
abgeranzte 5 Euro drin. Ein richtig kaputter, schäbiger 5 Euro Schein, wo ich mir gedacht habe,
|
|
|
0:02:09 – 0:02:18
die Regierung hat doch das Geld, warum geben sie keine neuen Scheine aus? Aber nur das so am Rande.
|
|
|
0:02:18 – 0:02:24
Auf dem Brief war noch ein QR-Code, mit dem man halt zur Umfrage kam.
|
|
|
0:02:24 – 0:02:27
Sonst stand da nur ein bisschen bla bla bla bla drin.
|
|
|
0:02:27 – 0:02:31
Und ich fand das im Grunde genommen interessant.
|
|
|
0:02:31 – 0:02:34
Ich mache ja öfters mal so Umfragen.
|
|
|
0:02:34 – 0:02:36
Also ich habe schon für Infratest das gemacht.
|
|
|
0:02:36 – 0:02:40
Und interessanterweise werde ich da immer wieder mal ausgewählt,
|
|
|
0:02:40 – 0:02:44
um halt an solchen Umfragen teilzunehmen.
|
|
|
0:02:44 – 0:02:53
Also das geht manchmal um diese typische Standardfragen, was ist der höchste Bildungsgrad,
|
|
|
0:02:53 – 0:03:02
den man halt hat, wie viele Familienmitglieder und sowas hat der Haushalt, wie viele Personen
|
|
|
0:03:02 – 0:03:12
leben im Haushalt und dieses Mal war die Umfrage ein bisschen anders. Es ging nämlich um Lernen
|
|
|
0:03:12 – 0:03:21
fürs Leben quasi so, wie weit man halt Bildungsangebote genutzt hat, um sich halt weiterzubilden. Also es
|
|
|
0:03:21 – 0:03:27
war nicht so diese typischen Datenerhebungen, was ist das Jahreseinkommen des Haushaltes und so
|
|
|
0:03:27 – 0:03:33
was, sondern es ging schon ziemlich spezifisch. Und das fand ich cool und sehr interessant.
|
|
|
0:03:33 – 0:03:41
Ja, und da könnte man jetzt eigentlich die Geschichte schon abschließen, weil ich brauche
|
|
|
0:03:41 – 0:03:47
jetzt nicht einfach aufzuzählen, was ich da halt alles beantwortet habe. Ist ja auch
|
|
|
0:03:47 – 0:03:55
todlangweilig. Aber bis jetzt habe ich noch nie gehört, dass jemand für eine
|
|
|
0:03:55 – 0:04:01
Befragung als kleines Dankeschön fünf Euro bekommen hat. Ich glaube, das ist
|
|
|
0:04:01 – 0:04:09
etwas, was ich mir einrahmen werde. Das werde ich mir an der Wand hängen, weil ich
|
|
|
0:04:09 – 0:04:17
Ich finde das so kurios, die Tatsache, dass das verschickt wird.
|
|
|
0:04:17 – 0:04:21
Und dann fragt man sich auch eigentlich, wie teuer ist das?
|
|
|
0:04:21 – 0:04:25
Wie hoch sind die Ausgaben für solche Sachen?
|
|
|
0:04:25 – 0:04:32
Also ich habe da mit meinen Bekannten und Kollegen darüber gesprochen und keiner kennt
|
|
|
0:04:32 – 0:04:35
jemand, der so etwas selber erlebt hat.
|
|
|
0:04:35 – 0:04:45
Also wie gesagt, ich mache sowas öfters mit. Manchmal nerven mich dann auch die Fragen,
|
|
|
0:04:45 – 0:04:57
dann ärgere ich mich jedes Mal, worauf hast du dich da eingelassen und warum machst du das überhaupt?
|
|
|
0:04:57 – 0:05:07
weil diese Fragen sich dann wiederholen, aber sie sind dann halt nur umgestellt. Also quasi ist das
|
|
|
0:05:07 – 0:05:12
die eine. Einmal ist die Frage so gestellt, dass man sie mit ja beantworten kann und das nächste
|
|
|
0:05:12 – 0:05:17
Mal ist sie so gestellt, dass man sie mit nein beantworten kann. Ich weiß warum man das macht,
|
|
|
0:05:17 – 0:05:26
das ist quasi so eine Doppeltverifikation. Damit schließt man halt aus, dass jemand sich
|
|
|
0:05:26 – 0:05:33
halt so zufällig durchklickt, weil das dann halt auffällig ist in der Statistik. Ich meine,
|
|
|
0:05:33 – 0:05:39
ich habe das in meinen Umfragen, die ich halt im Rahmen meines Studiums gemacht habe, ja auch so
|
|
|
0:05:39 – 0:05:46
gemacht. Und selbst dann nochmal nach einer längeren Zeit, also wenn da jetzt mehrere Fragen dazwischen
|
|
|
0:05:46 – 0:05:52
waren, habe ich dann auch immer wieder solche Verifizierungsfragen gestellt. Das ist ein total
|
|
|
0:05:52 – 0:06:00
"Legitimes Mittel". Nur wenn man das halt durchschaut, dann nervt das schon wirklich,
|
|
|
0:06:00 – 0:06:08
dann nervt das hart. Ich habe in meinem Leben wirklich einen Haufen von diesen Umfragen gemacht
|
|
|
0:06:08 – 0:06:15
und interessanterweise die letzten Umfragen waren meistenteils gewesen zu wissenschaftlichen
|
|
|
0:06:15 – 0:06:24
Befragungen im Rahmen der Podcast-Welt. Ich bin da ja halt in verschiedenen Foren drin und ich glaube
|
|
|
0:06:24 – 0:06:31
eins der wichtigsten ist das Sende-Gate und da kommen regelmäßig halt junge forschende Menschen
|
|
|
0:06:31 – 0:06:40
rein, um halt zu fragen, wie das gerade aussieht und so. Und für die ist ja interessant, dass sie
|
|
|
0:06:40 – 0:06:49
das ja nicht nur aus hörender Sicht bekommen, sondern halt auch als machender. Wie sind Leute,
|
|
|
0:06:49 – 0:06:54
die sich selber mit Podcast-Produktion beschäftigt, halt auf gewisse Fragenkomplexe halt eingestellt?
|
|
|
0:06:54 – 0:07:03
Ja, und das ist dann immer interessant, wenn man selber solche Fragebögen gemacht hat,
|
|
|
0:07:03 – 0:07:11
sich anzuschauen, wie diese jetzt gemacht sind. Und manchmal stelle ich mich wirklich die Frage,
|
|
|
0:07:11 – 0:07:17
wie hoch der wissenschaftliche Wert ist. Denn wenn man in solchen super kleinen Gruppen solche
|
|
|
0:07:17 – 0:07:26
Umfragen macht, ja, das ist dann schon manchmal so eine Verzerrung. Tja, aber die werden schon
|
|
|
0:07:26 – 0:07:32
wissen, was sie da machen. Ich lasse mich dann auch immer gerne über die Ergebnisse informieren,
|
|
|
0:07:32 – 0:07:42
weil ich das immer hoch spannend finde, wenn ich schon damit gemacht habe. Am schlimmsten fand ich
|
|
|
0:07:42 – 0:07:50
so die Umfragen, so diese Grundumfragen von Infratest und wie sie alle heißen, wenn man da
|
|
|
0:07:50 – 0:07:58
soll, die halt den Grunddaseinsatz erstellt, worauf dann halt die nächsten Befragungen halt hinauslaufen.
|
|
|
0:07:58 – 0:08:04
Die finde ich immer nervig, weil das sind immer so extrem umfangreiche Fragebögen.
|
|
|
0:08:04 – 0:08:07
Und da sollte man auch sehr vorsichtig sein, wo man das macht.
|
|
|
0:08:07 – 0:08:19
Denn da sollte man nur, ja, wie heißt das Wort jetzt, Umfrageinstitute nehmen,
|
|
|
0:08:19 – 0:08:25
die halt auch, wie heißt das, klassifiziert sind, verifiziert.
|
|
|
0:08:25 – 0:08:34
Also am liebsten halt die mit der ARD oder CTF und wie sie alle heißen, Infratest zum Beispiel.
|
|
|
0:08:34 – 0:08:41
Damit, bei denen kann man diese Umfragen machen, definitiv. Aber es gibt auch welche,
|
|
|
0:08:41 – 0:08:45
die halt die Daten abgreifen und dann kriegt man halt ziemlich viel Werbepost.
|
|
|
0:08:45 – 0:08:51
Interessanterweise für Sachen, für die man sich interessiert. Kein Wunder,
|
|
|
0:08:51 – 0:08:59
man hat denen ja die Daten dafür gegeben. Apropos Daten. Ich habe die letzten Tage damit verbracht,
|
|
|
0:08:59 – 0:09:08
sehr viel zu programmieren und habe eine schöne Möglichkeit gefunden,
|
|
|
0:09:08 – 0:09:15
kontextbasierte Suchen zu machen. Wir alle kennen das ja so Schlagwörter suchen. Wenn ich zum
|
|
|
0:09:15 – 0:09:25
Beispiel jetzt, was könnte man jetzt so suchen? Frank Battermann. Dann tippt man das ein und dann
|
|
|
0:09:25 – 0:09:32
werden halt alle Textstellen gefunden, wo das Wort Frank Battermann vorkommt, also die beiden Wörter.
|
|
|
0:09:32 – 0:09:36
Wenn man das jetzt noch ein bisschen intelligenter macht, dann könnte man ja auch noch sagen,
|
|
|
0:09:36 – 0:09:41
dass man mit bolischen Operatoren arbeitet und dann würden ausgesucht werden alle Stellen,
|
|
|
0:09:41 – 0:09:46
wo Frank drin vorkommt, alle Stellen wo Frank, Battermann vorkommt, alle Stellen wo Battermann
|
|
|
0:09:46 – 0:09:55
vorkommt und alle Stellen wo Battermann und Frank vorkommen. Das ist aber blöd. Besser ist,
|
|
|
0:09:55 – 0:10:00
wenn man kontextbasierte Suche hat. Also wenn man jetzt zum Beispiel sucht, so eine Stelle wie,
|
|
|
0:10:00 – 0:10:10
da haben sich die Schrottfunks oder Schrottcaster mit anderen getroffen. Das wäre doch interessant,
|
|
|
0:10:10 – 0:10:18
wenn man da halt verschiedene Möglichkeiten, verschiedene, also verschiedene sinnhafte
|
|
|
0:10:18 – 0:10:26
Möglichkeiten wie diese Schrottfunks wieder überall, überall findet man Schrottfunk,
|
|
|
0:10:26 – 0:10:37
Schrottcast und solche Sachen. Aber wie macht man das? Man setzt jedes Wort in einen Vektor.
|
|
|
0:10:37 – 0:10:46
Was ist ein Vektor? Das sind Richtungsangaben, ganz einfach runtergebrochen. Das könnte man jetzt noch
|
|
|
0:10:46 – 0:10:53
viel komplizierter erklären. Aber wenn ich jetzt einen Vektor habe, der eine Richtung angibt,
|
|
|
0:10:53 – 0:11:01
da sind das ja meistens drei Werte, also x, y und z. Wenn ich jetzt hingehe, für so eine
|
|
|
0:11:01 – 0:11:09
kontextbasierte Suche diese Vektoren anstelle, dann ist das in einem einfachsten Fall hat der
|
|
|
0:11:09 – 0:11:19
1521 Dimensionen. Das ist ein bisschen mehr wie drei. Also wir bewegen uns in einem
|
|
|
0:11:19 – 0:11:27
dreidimensionalen Raum. Tiefe, Breite, Höhe. Wenn ich jetzt eine vierte Dimension dazu nehme,
|
|
|
0:11:27 – 0:11:34
sagen wir mal die Zeit, dann könnte ich ja auch diese Breite, Höhe, Tiefe über die Zeit beobachten
|
|
|
0:11:34 – 0:11:44
und darüber eine Veränderung sehen. Jetzt hat aber für diese kontextbasierte Suche jeder Vektor 1500
|
|
|
0:11:44 – 0:11:53
blablabla Dimensionen. Das macht die Datenmenge ziemlich hoch, weil diese Vektoren, diese einzelnen
|
|
|
0:11:53 – 0:12:05
Dimensionen werden, ich glaube, in 10- oder 12-stelligen Zahlen beschrieben. Da wird natürlich
|
|
|
0:12:05 – 0:12:13
aus einer 10-Kilobyte-großen Nachricht gerne mal 1,5 Megabyte. Aber der Nutzen, den man
|
|
|
0:12:13 – 0:12:20
daraus sieht, der ist goldwert. Ich könnte zum Beispiel, wenn ich diese Daten in ChatGBT
|
|
|
0:12:20 – 0:12:24
eingebe und das Sprachmodell benutze, um das zu analysieren.
|
|
|
0:12:24 – 0:12:29
ChatGBT fragen, an welcher Stelle hat Frank Battermann zum Beispiel gesagt,
|
|
|
0:12:29 – 0:12:39
"Der Schrottkast ist dumm." Zum Beispiel. Rein hypothetisch gesehen.
|
|
|
0:12:39 – 0:13:02
Dann würde dann geguckt werden, nicht nur nach "der Schrott Kast ist dumm", sondern nach allen möglichen synonymen, sinnhaften Ähnlichkeiten.
|
|
|
0:13:02 – 0:13:12
Anstatt "dumm" würde dann "blöd" oder "nicht kompetent", "keine kognitive Transferleistung"
|
|
|
0:13:12 – 0:13:14
zum Beispiel gesucht werden.
|
|
|
0:13:14 – 0:13:18
Und dann kämen da halt Ergebnisse, die ein Scoring haben.
|
|
|
0:13:18 – 0:13:25
Also eine Einschätzung, wie nah diese Bedeutung an der ursprünglichen Frage ist.
|
|
|
0:13:25 – 0:13:30
Und dann werden die Ergebnisse quasi wie so ein Ranking ausgegeben.
|
|
|
0:13:30 – 0:13:38
Das können natürlich verschiedenste Stellen in so einem Textdokument sein, die halt näher oder
|
|
|
0:13:38 – 0:13:45
weniger nah an der eigentlichen Frage sind. Aber es ist hochgradig interessant, sich mit
|
|
|
0:13:45 – 0:13:56
diesem Thema zu beschäftigen, weil aus wissenschaftlicher Sicht oder aus wissenschaftlicher
|
|
|
0:13:56 – 0:14:05
Perspektive ergeben sich daraus riesige Möglichkeiten, Chat-Verläufe, Kommentare,
|
|
|
0:14:05 – 0:14:14
Transkripte zu durchsuchen und einfach so nach Stellen zu schauen, die interessant sein könnten.
|
|
|
0:14:14 – 0:14:21
Zum Beispiel in stundenlangen Podcasts, die man nachts geführt hat zum Beispiel,
|
|
|
0:14:21 – 0:14:27
könnte man damit einfach immer wieder interessante und sensible Stellen finden,
|
|
|
0:14:27 – 0:14:40
die halt aufschlussreich sind. Kleine Geschichten, kleine Erzählungen und das ist einfach für die
|
|
|
0:14:40 – 0:14:47
Datenlage Gold wert. Ja, damit habe ich mich beschäftigt. Interessanterweise sind diese
|
|
|
0:14:47 – 0:14:56
Modelle die diese Analysen durchführen. Erstens unwahrscheinlich billig, denn ich glaube ein
|
|
|
0:14:56 – 0:15:08
Token kostet 0,0000002 Cent. Also wenn man hingeht und die gesamten Videos der Fernsehschatztruhe,
|
|
|
0:15:08 – 0:15:16
die Transkripte damit analysieren lässt, kommt man auf einen Gesamtpreis von weniger als 2
|
|
|
0:15:16 – 0:15:27
Dollar. Das muss man sich mal vorstellen. Und das sind auch irgendwie so 1300 Videos. Das ist so funny.
|
|
|
0:15:27 – 0:15:39
Ja, da ist die Anfrage an ChatGBT und so weiter wesentlich teurer als das, wenn man das über die
|
|
|
0:15:39 – 0:15:41
die Programmier-Schnittstelle macht.
|
|
|
0:15:41 – 0:15:48
Und alleine schon nur für einen kurzen Teil eines langen Textes.
|
|
|
0:15:48 – 0:15:52
Tja, ich bin echt so ein Technik-Nerd.
|
|
|
0:15:52 – 0:15:57
Und dieses Programmieren, das hat mir so viel Spaß gemacht,
|
|
|
0:15:57 – 0:16:02
weil man so schnell gute Ergebnisse erzielt hat.
|
|
|
0:16:02 – 0:16:06
Und wenn man das Ganze dann quasi auch noch in einer Datenbank packt,
|
|
|
0:16:06 – 0:16:14
die übers Internet erreichbar ist und dann auch noch eine Webseite dazu baut,
|
|
|
0:16:14 – 0:16:19
dann kann da eigentlich jeder hingehen und auf diesen Datenbestand zugreifen.
|
|
|
0:16:19 – 0:16:23
Ich meine, das ist ein totaler Brainfuck.
|
|
|
0:16:23 – 0:16:27
Ich meine, das könnte jemand ja mal machen.
|
|
|
0:16:27 – 0:16:37
Und dann könnte man kontextbehaftet explizit nach interessanten Stellen suchen.
|
|
|
0:16:37 – 0:16:41
Und das könnte dann jeder machen, der da Bock drauf hat.
|
|
|
0:16:41 – 0:16:45
Hm, irgendwie witzig, oder?
|
|
|
0:16:45 – 0:16:48
Sollte vielleicht mal jemand machen.
|
|
|
0:16:48 – 0:16:59
Aber nochmal zurück zu Umfragen. Habt ihr das schon so gemacht oder seid ihr davon auch so
|
|
|
0:16:59 – 0:17:10
ziemlich angenervt? Haben sie mal Zeit für eine kleine Umfrage? Also Straßenumfragen finde ich
|
|
|
0:17:10 – 0:17:18
ganz schlimm. Ich hatte nie Zeit, ich habe da nie Zeit und ich werde auch nie Zeit dafür haben,
|
|
|
0:17:18 – 0:17:26
denn ich suche mir ganz genau aus, wo ich eine Umfrage mache. Ich finde es wirklich interessant,
|
|
|
0:17:26 – 0:17:34
dass in der heutigen Zeit, wo man eigentlich unbegrenzt quasi auf Datenzugriff hätte,
|
|
|
0:17:34 – 0:17:48
immer noch die gute alte Umfrage so ein wichtiges Instrument ist, um quasi eine Momentaufnahme für
|
|
|
0:17:48 – 0:17:58
Stimmung, für Interessen, für alle möglichen Gründe – kauf ich mir jetzt ein Auto, wenn ich
|
|
|
0:17:58 – 0:18:03
mir ein Auto kaufen würde, welche Marke das wäre, wie viel Geld bin ich bereit für ein neues Auto
|
|
|
0:18:03 – 0:18:10
auszugeben, dass all diese Sachen halt erhoben werden und das quasi immer noch in so einer
|
|
|
0:18:10 – 0:18:18
1-zu-1-Situation. Man könnte ja auch einfach halt Big Tech nutzen und dann halt Big Data,
|
|
|
0:18:18 – 0:18:26
denn das, was Google und Co. über uns wissen, das ist so unglaublich. Es gibt einen Link,
|
|
|
0:18:26 – 0:18:37
der ist in dem Google Profil drin und wenn man den anklickt, ich weiß es nicht genau wie der
|
|
|
0:18:37 – 0:18:44
noch heißt, aber den hatte ich halt mal vor einiger Zeit mal angeklickt und dann steht da genau drin,
|
|
|
0:18:44 – 0:18:51
was Google über einen weiß und das ist unglaublich. Wenn man dann auch mal so schaut nach den
|
|
|
0:18:51 – 0:18:58
Interessen so von den letzten Suchverläufen, dann tauchen da alle möglichen Sachen auf.
|
|
|
0:18:58 – 0:19:06
Und das ist wirklich hochinteressant, denn daraus schließt Google auf verschiedenste
|
|
|
0:19:06 – 0:19:12
Sachen. Und wollen wir mal so sagen, 99 Prozent sind ziemlich korrekt. Also da kann man mal sehen,
|
|
|
0:19:12 – 0:19:21
was diese Firmen mit ihrer ganzen Datensammlerei für ein unglaubliches Wissen angehäuft haben.
|
|
|
0:19:21 – 0:19:26
Und das Interessante ist ja auch, wenn ich jetzt hingehe und ich klicke auf Google
|
|
|
0:19:26 – 0:19:33
"neues Computergehäuse" an, weil ich da was suche, weil ich mir da vielleicht einen kleinen
|
|
|
0:19:33 – 0:19:47
Server zusammenbaue für weitere Aufgaben, wie halt Vektordaten zu erstellen. Dann kriege ich auf
|
|
|
0:19:47 – 0:19:58
Facebook, in LinkedIn und überall Werbung für Computergehäuse und zwar für Server Computergehäuse
|
|
|
0:19:58 – 0:20:06
fürs Rack und da sieht man einfach, wie vernetzt das alles ist und die ganzen Cookies, die man
|
|
|
0:20:06 – 0:20:15
halt sich pflanzt in seinem Browser, wie die alle Daten austauschen und die Werbenetzwerke dann
|
|
|
0:20:15 – 0:20:23
greifen. Das sind einfach alles Daten, die irgendwie irgendwo erhoben werden. Und das
|
|
|
0:20:23 – 0:20:31
wäre doch interessant, wenn das ausgenutzt werden würde, anstatt solche Befragungen zu machen. Aber
|
|
|
0:20:31 – 0:20:37
das ist natürlich dann wieder das Problem mit dem Datenschutz und der Datensicherheit. Da haben wir
|
|
|
0:20:37 – 0:20:45
in Europa ja sowieso zu totalen Fäbel für. Wenn ich überlege, bevor die Datengrundschutzverordnung
|
|
|
0:20:45 – 0:20:54
aktiv war, konnte ich wesentlich mehr mit meiner Webseite machen. Jetzt ist das alles anonymisiert
|
|
|
0:20:54 – 0:21:01
und verschlüsselt und die Daten müssen so sein, dass die halt auch löschbar sind. Und das macht
|
|
|
0:21:01 – 0:21:06
halt alles ein bisschen aufwendiger. Aber den Grundgedanken dahinter verstehe ich ja, dass
|
|
|
0:21:06 – 0:21:13
jeder halt selber entscheiden sollte, was mit seinen Daten passiert. Aber außerhalb von Europa
|
|
|
0:21:13 – 0:21:25
werden die Daten gesammelt und das nicht nur massenhaft, sondern tonnenweise. Man muss sich
|
|
|
0:21:25 – 0:21:33
mal vorstellen, ich hatte ein Video gesehen gehabt von Semophois, das ist ein Tech-Youtuber,
|
|
|
0:21:33 – 0:21:41
der berichtet halt über interessante technologische Sachen mit KI und was er alles so programmiert und
|
|
|
0:21:41 – 0:21:49
Ab und zu mal erzählt er auch aus Nähkästchen. Und er sagte, er kann nicht mehr in die USA einreisen,
|
|
|
0:21:49 – 0:21:57
weil, das muss man sich mal vorstellen, er kritisch über Trump berichtet hat. Und jetzt ist das so,
|
|
|
0:21:57 – 0:22:03
die sammeln nicht nur die Daten über denjenigen, der sich mal kritisch geäußert hat gegenüber Trump,
|
|
|
0:22:03 – 0:22:13
sondern auch über diejenigen, die diesen kennen. Und das ist noch nicht genug, sondern diejenigen,
|
|
|
0:22:13 – 0:22:24
die die kennen, der den kennt. Und das ist unglaublich viel. Es gibt auch diese Kevin-Bacon-Zahl.
|
|
|
0:22:24 – 0:22:32
Das heißt, dass man über sechs Personen jede andere Person auf der Welt kennt.
|
|
|
0:22:32 – 0:22:35
Im Endeffekt Kevin Bacon.
|
|
|
0:22:35 – 0:22:40
Also ich kenne jemand, der jemanden kennt, der jemanden kennt und das ganze sechs mal
|
|
|
0:22:40 – 0:22:43
und der kennt garantiert Kevin Bacon.
|
|
|
0:22:43 – 0:22:45
Das ist wow.
|
|
|
0:22:45 – 0:22:48
Krass oder?
|
|
|
0:22:48 – 0:22:51
Das muss man sich mal überlegen.
|
|
|
0:22:51 – 0:22:58
Und deswegen, wenn die hingehen und quasi die Hauptperson und dann derjenige, der kennt
|
|
|
0:22:58 – 0:23:02
und der jemanden kennt, wie viele Menschen das sind.
|
|
|
0:23:02 – 0:23:05
Das ist unglaublich.
|
|
|
0:23:05 – 0:23:10
Ja, so ist das.
|
|
|
0:23:10 – 0:23:14
Und da werden alle Daten erhoben, alles was man finden kann.
|
|
|
0:23:14 – 0:23:21
Und da wir alles fleißig amerikanische Dienste nutzen, ist natürlich auch alles in Amerika
|
|
|
0:23:21 – 0:23:27
gespeichert. Ein Schelm der dabei Böses denkt. Also ich würde persönlich auch nicht in die USA
|
|
|
0:23:27 – 0:23:36
zurzeit reisen wollen. Könnte sein, dass ich bei der Eingangsabfertigung verhaftet werde und mich
|
|
|
0:23:36 – 0:23:45
dann in einem tollen Gespräch mit den Beamten dort unterhalten kann. Da hätte ich auch weniger Bock
|
|
|
0:23:45 – 0:23:52
drauf. Also da kann man mal sehen, was man so abseits von Umfragen alles mit solcher
|
|
|
0:23:52 – 0:23:59
Datenerhebung machen kann. Und die Überlegungen, ob man halt mehr Eigenständigkeit in Europa
|
|
|
0:23:59 – 0:24:12
praktizieren sollte, sind echt sowas von wichtig. Digitale Souveränität heißt das. Und wir sollten
|
|
|
0:24:12 – 0:24:21
und wir tun auch Guter daran, wenn wir uns so unabhängig wie möglich machen. Leider kann man
|
|
|
0:24:21 – 0:24:29
manche Sachen einfach nicht so ersetzen. Die Angebote in der künstlichen Intelligenz, die in
|
|
|
0:24:29 – 0:24:39
Europa existieren, sind einfach noch nicht so gut und auf so einem Level wie halt die amerikanischen
|
|
|
0:24:39 – 0:24:41
oder auch chinesischen Produkte.
|
|
|
0:24:41 – 0:24:45
Aber ich bin guter Hoffnung, dass das kommen wird.
|
|
|
0:24:45 – 0:24:50
Und für alle anderen Sachen gibt es mittlerweile genügend Alternativen.
|
|
|
0:24:50 – 0:24:54
Also anstatt Cloudflare kann man
|
|
|
0:24:54 – 0:24:59
Bunny CND benutzen,
|
|
|
0:24:59 – 0:25:05
anstatt Gmail oder Google Mail kann man halt Proton Mail benutzen.
|
|
|
0:25:06 – 0:25:14
Und es gibt so viele andere europäische Anbieter, die auch nichts in US-Rechenzentren machen.
|
|
|
0:25:14 – 0:25:17
Da muss man sich informieren.
|
|
|
0:25:17 – 0:25:23
The Morpheus hat da ein interessantes Projekt und diese bauen eine Datenbank auf mit europäischen
|
|
|
0:25:23 – 0:25:26
Alternativen zu US-Produkten.
|
|
|
0:25:26 – 0:25:34
Und da ist natürlich auch viele freie Software oder auch Dienstleistungen dabei, die stellenweise,
|
|
|
0:25:34 – 0:25:41
kostenpflichtig sind, sogar kostengünstiger sind, wie die amerikanischen. Sollte man sich mal angucken,
|
|
|
0:25:41 – 0:25:47
wenn man sich dafür interessiert. Also für mich ist das halt eine ganz wichtige Sache,
|
|
|
0:25:47 – 0:25:59
denn meine Daten sind mir wichtig. Gut, bin ich heute abgeschweift? Ein kleines bisschen. Ich
|
|
|
0:25:59 – 0:26:03
Ich habe ein bisschen zu viel über Vektoren geredet und was man damit machen kann.
|
|
|
0:26:03 – 0:26:10
Okay, dann sage ich Dankeschön und bis zum nächsten Mal.
|
|
|
0:26:10 – 0:26:11
Tschüss, euer Sascha.
|
|
|
0:26:11 – 0:26:13
[Musik]
|
|
|
0:26:13 – 0:26:16
[Musik]
|
|
|
0:26:16 – 0:26:22
[Musik]
|
|
|
0:26:22 – 0:26:28
[Musik]
|
|
|
0:26:28 – 0:26:34
[Musik]
|
|
|
0:26:34 – 0:26:40
[Musik]
|
|
|
0:26:40 – 0:26:43
[Musik]
|
|
|
0:26:43 – 0:26:49
[Musik]
|
|
|
0:26:49 – 0:26:55
[Musik]
|
|
|
0:26:55 – 0:27:01
[Musik]
|
|
|
0:27:01 – 0:27:08
[Musik]
|
|
|
0:27:08 – 0:27:11
[Musik]
|
|
|
0:27:11 – 0:27:17
[Musik]
|
|
|
0:27:17 – 0:27:23
[Musik]
|
|
|
0:27:23 – 0:27:29
[Musik]
|
|
|
0:27:29 – 0:27:35
[Musik]
|
|
|
0:27:35 – 0:27:38
[Musik]
|
|
|
0:27:38 – 0:27:44
[Musik]
|
|
|
0:27:44 – 0:27:50
[Musik]
|
|
|
0:27:50 – 0:27:56
[Musik]
|
|
|
0:27:56 – 0:28:02
[Musik]
|
|
|
0:28:02 – 0:28:05
[Musik]
|
|
|
0:28:05 – 0:28:11
[Musik]
|
|
|
0:28:11 – 0:28:17
[Musik]
|
|
|
0:28:17 – 0:28:23
[Musik]
|
|
|
0:28:23 – 0:28:29
[Musik]
|
|
|
0:28:29 – 0:28:32
[Musik]
|
|
|
0:28:32 – 0:28:38
[Musik]
|
|
|
0:28:38 – 0:28:44
[Musik]
|
|
|
0:28:44 – 0:28:50
[Musik]
|
|
|
0:28:50 – 0:28:56
[Musik]
|
|
|
0:28:56 – 0:28:59
[Musik]
|
|
|
0:28:59 – 0:29:06
[Musik]
|
|
|
0:29:06 – 0:29:12
[Musik]
|
|
|
0:29:12 – 0:29:19
[Musik]
|
|
|
0:29:19 – 0:29:22
[Musik]
|
|
|
0:29:22 – 0:29:28
[Musik]
|
|
|
0:29:28 – 0:29:34
[Musik]
|
|
|
0:29:34 – 0:29:40
[Musik]
|
|
|
0:29:40 – 0:29:46
[Musik]
|
|
|
0:29:46 – 0:29:49
[Musik]
|
|
|
0:29:49 – 0:29:55
[Musik]
|
|
|
0:29:55 – 0:30:01
[Musik]
|
|
|
0:30:01 – 0:30:07
[Musik]
|
|
|
0:30:07 – 0:30:13
[Musik]
|
|
|
0:30:13 – 0:30:31
[Musik]
|
Man geht nichtsahnend zum Briefkasten – und plötzlich liegt da ein Brief von einer Institution der Bundesregierung. Darin: ein kleiner Umschlag, ein QR-Code zu einer Umfrage und tatsächlich fünf Euro als Dankeschön. Ein ziemlich ramponierter Fünfer, aber immerhin.
Aus dieser kleinen Begebenheit entwickelt sich eine typische Abschweifung: Wie funktionieren eigentlich Umfragen? Warum werden Fragen oft doppelt gestellt? Und wie zuverlässig sind solche Datenerhebungen überhaupt?
Von dort führt der Gedanke schnell weiter zu einem viel größeren Thema: Daten. Während klassische Umfragen Menschen direkt befragen, sammeln große Plattformen im Hintergrund längst riesige Mengen an Informationen über Interessen, Verhalten und Entscheidungen. Was früher mit Fragebögen gemacht wurde, passiert heute oft automatisiert über Suchanfragen, Cookies und Nutzerprofile.
Und dann wird es nerdig: Was passiert, wenn man Texte nicht nur nach Stichwörtern durchsucht, sondern nach Bedeutung? Kontextbasierte Suche mit Vektoren ermöglicht es, Inhalte nach ihrem Sinn zu finden – nicht nur nach einzelnen Wörtern. Ein spannender Blick darauf, wie moderne KI-Systeme Texte analysieren, Transkripte durchsuchen oder in riesigen Datenmengen Zusammenhänge erkennen können.
Eine Episode über Umfragen, Datensammlungen, künstliche Intelligenz und die Frage, wie viel wir eigentlich über uns preisgeben – manchmal freiwillig, manchmal unbemerkt.
Und natürlich die wichtigste Erkenntnis des Tages:
Offenbar ist meine Meinung genau fünf Euro wert.

Themenübersicht:
Der Brief im Briefkasten
Ein unerwarteter Brief einer staatlichen Institution – und ein fünf Euro Schein als Dankeschön für eine Umfrage.
Warum Umfragen Fragen doppelt stellen
Wie Fragebögen aufgebaut sind und warum manche Fragen scheinbar identisch gestellt werden.
Meine Erfahrungen mit wissenschaftlichen Befragungen
Podcast-Umfragen, Studien aus der Community und der wissenschaftliche Wert kleiner Stichproben.
Wann Umfragen sinnvoll sind – und wann nicht
Seriöse Institute vs. Datensammler und warum man vorsichtig sein sollte.
Big Data statt Fragebogen
Was große Plattformen ohnehin schon über unsere Interessen wissen.
Tracking und Werbenetzwerke
Warum nach einer Suche plötzlich überall passende Werbung auftaucht.
Nerd-Exkurs: Kontextbasierte Suche mit Vektoren
Wie moderne Systeme Texte nicht nur nach Wörtern, sondern nach Bedeutung durchsuchen.
KI, Datenbanken und riesige Transkripte
Warum diese Technik besonders spannend für Podcasts, Kommentare und große Textsammlungen ist.
Digitale Souveränität in Europa
Warum Alternativen zu großen US-Diensten immer wichtiger werden.
Fazit der Abschweifung
Eine kleine Umfrage, ein zerknitterter Fünfer – und überraschend viele Gedanken über Daten, KI und unsere digitale Welt.
Links zur Ausgabe:
Werbung:
Mitwirkende dieser Episode
Spieldauer: 0:30:32
Tag der Aufnahme: 05.03.26
Diese Folge stammt aus der Staffel 4, es gibt insgesamt 4 Staffeln.
Eine LautFunk Publikationskartell Produktion - Wo Geschichten unüberhörbar übermittelt werden.
Podcast Lizenz:
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License
Hinweis: Dieser Beitrag enthält Affiliate-Links. Wenn du über diese Links einkaufst, erhalte ich eine kleine Provision ohne zusätzliche Kosten für dich.
Ähnliche Beiträge
Autor: Sascha Markmann
Sascha Markmann ist ein kreativer Kopf mit bewegter Biografie: Informatiker, studierter Philosoph, Religionswissenschaftler und Psychologe – und gleichzeitig ein Mensch, der das Leben nach einem Schlaganfall ganz neu entdeckt hat. Nach Stationen als Rettungssanitäter und Altenpfleger fand Sascha seinen Weg in die Welt des kreativen Ausdrucks: Als Blogger, Musiker, Podcaster, Philosoph und visueller Geschichtenerzähler kombiniert er technisches Know-how mit emotionaler Tiefe und einem schrägen Sinn für Humor. Seine Beiträge entstehen irgendwo zwischen Borderline, Acid Bassline und Beistand – ehrlich, direkt und gerne auch mal mit einem Augenzwinkern. Leitmotiv: „Audiovisueller Stumpfsinn mit keinem Nutzwert – aber vielleicht genau deshalb so wertvoll.“ Alle Beiträge von Sascha Markmann anzeigen