Laut gedacht
Data Scientist und Informatiker David Kriesel, der schon durch seinen Vortrag über den Xerox-Scanning-Bug internationales Aufsehen erregte, hat seit Mitte 2014 fast 100.000 Artikel von Spiegel-Online systematisch gespeichert. Diese Datenmasse beleuchtet David in einer sehr sehr interessanten Art und Weise.
19.01.2017
19.01.2017
Bewerten, Faven und mehr
Bewertung wurde übermittelt
Du kannst leider nicht mehr als einmal bewerten!
Kommentar schreiben
ich soll mir das ne Stunde reinziehen ... nö
Gevorratsdatenspeichert. Dafür soll es brennen!
Wie unendlich viel Arbeit in diesem vortrag steckt
Das Problem bei dem was er sagt ist das gleiche, wie bei dem Artikel den er zitiert: es bleibt sehr Vage... Er gibt vor, tief-schürfende Schlüsse ziehen zu können. Auf Basis von ein paar Daten zu Schlussfolgern wer mit wem zusammen ist... vollkommen an den Haaren herbei gezogen... selbst wenn es so einfach wäre - Zusammen Urlaub, also zusammen Sex -zwei Urlaubszyklen lassen doch keine statistisch signifikanten Schlüsse zu. Klar kann man damit herum spielen und Sachen sehen (die man sowieso erwartet hätte). Die Frage ist, ob das wirklich grundliegende Schlüsse zu lässt. Meiner Ansicht nach ist das alles viel zu primitiv.
richtig, und dann die überraschung: autoren, die zusammen artikel veröffentlichen, arbeiten im gleichen ressort! krass! aber nix für ungut @david, der talk ist auf jeden fall gut und auch unterhaltsam, besonders das mit den sprungfedern hat mir gefallen.
zu den Autoren die zusammenarbeiten: Er sagt doch auch garnicht, dass das irgendwie krass ist. Es ist einfach nur ne schöne Grafik, die man aus den Daten machen kann. Sinn des Vortrags ist doch auch Grenzen und Möglichkeiten von BigData aufzuzeigen, damit jeder das dann für sich bewerten kann. Finde den Vortrag jetzt auch ncith in jeder Facette hervorragend, aber wenn er nicht auch ein bisschen effektheischend wäre, würden ihn mehr Leute langweilig finden. Dazu ob das mit den Urlaubstagen an den Haaren herbeigezogen ist: Das hat doch nichts mit statistischer Signifikanz zu tun. Entweder die Tage überlappen sich, oder eben nicht. Man kann dadurch ja schon mal schnell Kandidaten selektieren, bei denen es sich eventuell lohnt näher nachzuforschen. Das ist ja auch wieder nur ein Beispiel um zu verdeutlichen wie das Datamining funktionieren kann, um Rückschlüsse zu ziehen, die denen, die die Daten hergegeben haben vielleicht nicht lieb sind. Ich finde das nicht primitiv, sondern ein gelungenes Lehrstück. Und im Bereich der Kommentierbarkeit ist es doch auch durchaus tiefschürfend. Ich hatte auf jeden Fall einen Erkenntnisgewinn.
Das Thema ist auch unwichtig. Viel interessanter war das Thema um die Kommentierbarkeit. Hier gilt nur eine meinung und das ist die von spiegel online...
Hi, Ich schau auch viel SPON. Mag sein das du recht hast! Leider ist es aber auch so, dass das "randalieren" in den Kommentaren ziemlich überbordend ist. Wenn ich für den Inhalt und Verbreitung dieser Kommentare verantwortlich wäre (und dies ist SPON), würde ich mir das auch überlegen (Kostet ja Personal, und wer sagt, dass es ein Recht auf Kommentar gibt und das dies freier Meinungsäußerung entspricht). Die Kommentarfunktion für Artikelt zu deaktivieren, deren feedback erfahrungsgemäß in erhöhtem Review bzw. Haßkommentaren mündet sehe ich persönlich als in Ordnung an.
Beruhigt euch mal alle wieder ein bisschen, sonst sperrt ch.ill bei manchen Videos die Kommentierfunktion! ;)
"Wir machen jetzt DDOS auf die Bierbar" haha, den merk ich mir für nächste Uniquidditchmatch
alter, ich hoffe du meinst das mit dem uni quidditch match nicht ernst...
lol ich glaub kaum ... obwohl ... es gibt bestimmt leute die das bringen würden
Quidditch World Cup 2014 - Final - Texas State Quidditch vs. University of Texas - YouTube die da zB
oh man, wie krank ist das bitte. gibt echt verrückte menschen.
Definitiv ein Must See! Sehr genialer Vortrag!
ein Must see ist wenn ich deine Mum knalle du möchtegern Troll
Nehmen wir an, DerWesten ist ein Retortenkind von 2 Schwulen, ausgetragen von einer Leihziege. Jetzt hast du die Wahl: Ziege oder Mann - aber auf jeden Fall ein "MUST SEE".
willkommen im internet of things... dumm-ding trifft auf dumber-lumber...
wieder eine kassiert, du lappen!
sagt der Trottel der nichtmal den Unterschied zwischen austeilen und kassieren kennt du machst dich jedes mal lächerlich XDDDDDD immer wieder zum totlachen . Ich an deiner Stelle würde einfach die Fresse halten XDDDD
ich glaub an deiner stelle würde ich nochmal lesen was du geschrieben hast und was hier obendrüber für dünne jauche von dir steht. und sollte deine mickrige hirnwindung noch nicht überbeansprucht sein, dann reden wir nochmal übers einkassieren, ziegenficker!
interessant der oglum
Chill steckt auch schon mit denen unter einer Decke. Mir wird die Werbung für einen sprechenden Klopapierhalter angezeigt. Woher wissen die, dass öfters mal kacken muss???
auch ne form von big data... stichwort überernährung...
Er hat den Kot gek(n)ackt.
Lustig, aber an einigen Stellen falsch. 1. Weder der Autor und noch der Chefredakteur publiziert online Artikel, sondern ein Redakteur der "Publizierungsdienst" hat ("Kuratierung"). Viele Artikeln sind schon Tage oder Wochen davor geschrieben. Vor allem, die Artikel über Tod von Celebrities liegen vorbereitet in CMS, um per Knopfdruck publiziert zu werden. "Prinz Charles ist gestorben." Daher Minute 15:15 "wer schläft mit wem" ist falsch. 2. In 19:37 Kürzel unten im Artikel ist nicht die Autorname, sondern news agency. DPA - Deutsche Presse Agentur.BMA ist channel davon.
3. Jeder der Artikeln kann von 1 bis 3 unterschiedliche Titeln haben ("AB-Testing"). Einem Besucher der Seite wird ein Titel präsentiert, den anderem Nutzer die andere Titeln. Danach wird die Reichweite gemessen. Daher die Änderung am 44:30 sind irrelevant.
Du bist ja wirklich ein ganz schlauer Fuchs! Ich bin sicher, dass das der Herr Kriesel von deinen achso intelligenten Anmerkungen noch nie gehört hat.
Lustig aber der Einwand ist irrelevant, da es 1. bei diesem Vortrag um die Sensibilisierung mit eigenen "Rohdaten" geht und was damit angestellt werden kann. 2. Ging es hier auch nicht um die vorgenerierten Daten (oder haben die für anderhalb Jahre 100.000 Artikel vorgeneriert?) 3. Wenn es bei bestimmten Themen, Artikel und ähnlichem immer wieder die selben Muster zu erkennen sind lassen sich daraus Trends ableiten und die sind durchaus Aussagekräftig. Ach ja, wäre net2know welcher Channel BMA sein soll.
1 ja, aber wer nicht schreibt wird nicht veröffentlicht, hat also urlaub. passt also zumindest was die längeren lücken angeht. 2. die kürzel unten sind, wie er auch eindeutig sagt, beides. autorname und/oder nachrichtenagentur. 3. kommt als zuschauerfrage hinterher. in seinem datensatz war es größtenteils noch nicht so. er kann aber an neueren veränderungen erkennen das spiegel damit beginnt dieses verfahren zu testen.
Zu 2. sei das Impressum erwähnt: - SPIEGEL ONLINE Dort finden sich neben den Autoren die jeweiligen Kürzel wieder, die unter dem Artikel stehen. Übrigens mit dem jeweiligen Kürzel der Nachrichtenagentur. Beispiel: Melbourne: Mann rast mit Auto auf Fußweg - mehrere Tote - SPIEGEL ONLINE Darunter die Kürzel: max/dpa/AP/Reuters (laut Impressum Maximilian Rau (max))
Danke! Hochinteressant! Und zum Nachdenken:
Nichts zu verbergen? | c't Magazin
hätte nicht gedacht das mich das Video so fesselt. Liegt bestimmt auch daran, das er das auch so gut rüberbringt.
vorsicht, nicht alles verraten, sonst kommt dich der trumpf holen
ich hab keine angst vorm trumpf. ich hab nen bauern...
Geil. Echt beeindruckend sowas mal zu sehen wie das funktioniert.
hab mir das video vor kurzem auch gegeben. lang, aber wirklich interessant. ab minute 28:30 ist cool. Ch.ill, waere das hier ned auch angebracht? ;)
Würd mich auch mal interessieren wieoft hier aktuallisiert wird um n "First" hierzulassen.
Sehr interessanter Vortrag. VielenDank
Tut sich das ernsthaft jemand an?
Ja, und JEDER sollte sich irgendetwas in dieser richtung antun! egal ob dieses video, oder den OCEAN artikel (der hier auch angesprochen wird) oder irgendetwas, das zeigt, wie aus "harmlosen daten" (die ja niemand zu verstecken hat) unendlich viel herausgelesen werden kann (egal ob das dann richtig oder falsch interpretiert wird)
naja ich weiß nicht ... das heikelste war jetzt wer mit wem gleichzeitig in Urlaub geht
Das heikelste, das er auf dem Vortrag zeigen wollte...
ich hatte ja auch mehrere möglichkeiten genannt. richtig heikel wirds bei den facebook daten oder paypal daten oder google daten oder ... oder der summe. er zeigt hier, wie auch schon aus sehr "unheiklen" daten viel interpretiert werden kann. was dann auch heiklen daten interpretiert werden kann ist heftig (siehe vorhersage von schwangerschaften etc.)
Big Data: Schwanger ohne digitale Spuren | ZEIT ONLINE oder Big Data – Wie eine Supermarktkette in den USA die Schwangerschaft einer Teenagerin noch vor deren Vater entdeckte. | SAZ
Ich hadere noch. Meine Zeit ist wirklich sehr kostbar.
Ist spannend, kannste zum Früstück nebenbei laufen lassen.
alter schwede, der kopierer-vortrag -> "facel matter hits the rotary air deispenser". da zieht es einem die schuhe aus. hätte nie gedacht, dass ich mir das komplett angeschaut habe... jeder der je wegen einem "scan" angearscht wird, sollte direkt fragen, ob es ein xerox scanner war
Ich habe diesen Beitrag und auch den Xerox Beitrag mir angetan. Der David hats voll drauf. Was man alles mit Massendaten machen, anrichten und interpretieren kann ist schon echt bedrohlich. er hat es ja nur mit Spiegelonline demonstriert, die NSA macht das mit ein paar Terrabyte mehr :-) Wer weiß, was die alles interpretieren :-)
Ja, hat sich gelohnt
Ihr habt mich überzeugt. War interessant, aber doch etwas zeitintensiv.
Geiles Video, schaut es bis zum Schluss. Hab ich auch gemacht!
habe den anfang und das ende gesehen..
du hast doch nichtmal augen...
Hurra erster
Gratulation
nicht mal das video angeschaut aber erster schreien eh?
hefte raus, klassentest!
Muß man dazu erst ein Video vorher sehen? Wäre der Kommentar dann irgendwie qualifizierter/sachbezogener gewesen? o.O
Dein Kommentar wartet deswegen jetzt auf Begutachtung. Falls alles in Ordnung sein sollte, wird er natürlich freigeschaltet.
Deswegen kann ich diesen geänderten Kommentar nicht entgegennehmen.