Benvenuti

linuxiani, curiosi e vecchi digitali

have a seat, a cluster and dream

vi parliamo di #bigdata perchè odiamo la pubblicità




VIRGILIO
Business Intelligence addicted



GIORGIO
Cloud & BI evangelist











BIGDATA




http://www.perceptualedge.com/blog/?p=1460













non è esclusiva di una specifica MARCA (BRAND)





















non è la soluzione ad un determinato PROBLEMA









3V







(vedete la R di eal time? occhio alla pubblicità)
http://blogs.gartner.com/doug-laney/deja-vvvue-others-claiming-gartners-volume-velocity-variety-construct-for-big-data/
http://martinfowler.com/articles/bigData/



False Friends:

MAP-REDUCE

open your mind..eh già: devi ideare una strategia di risoluzione parallelizzabile



http://en.wikipedia.org/wiki/MapReduce
http://research.google.com/archive/mapreduce.html
http://en.wikipedia.org/wiki/BigTable






Le dò due fustini di Hadoop per il suo mongoDB

(ma è facile o difficile da usare?)







Case Study


KETTLE






Come intendiamo vendere il Big Data:




Ho visto cose...



Ho una tabella da 30 miliardi di record, cambiano tutti ogni 4 secondi e devo dare un excel al manager ogni 3...



La query su db mi va piano, migliora se ci metto sotto Big Data?



Il Big Data è l'ultimo dei tuoi problemi

Come elaborare un Terabyte di dati in minuti invece che in giorni

questo lo sappiamo fare



tabella