Rick van der Lans
R20/Consultancy
Big Data, Hadoop, NoSQL, analytical databaseservers, Spark, NewSQL, Mapreduce, appliances zijn de populaire termen van vandaag. Maar zijn dit tijdelijke hypes? Is dit technologie voor alleen de grote, bekende websites, zoals Bol.com, Amazon, LinkedIn, Twitter en Facebook, of heeft deze technologie wel degelijk traditionele organisaties iets te bieden? In dit seminar worden deze nieuwe ontwikkelingen helder toegelicht en wordt duidelijk gemaakt hoe, waar en waarom ze zeer relevant kunnen zijn voor meer traditionele organisaties.
Tijdens het seminar zullen voorbeelden van toepassingsgebieden van Big Data data gegeven worden. Een belangrijk toepassingsgebied is uiteraard analytics. Big data applicaties maken vormen van analytics mogelijk waarvan veel organisaties momenteel alleen kunnen dromen. Big data applicaties vereisen de opslag en verwerking van (soms extreem) grote hoeveelheden gegevens. Maar welke gegevensopslagtechnologie dient ingezet te worden? Bestaande, meer traditionele technologie haalt misschien niet de benodigde schaalbaarheid of alleen voor een onacceptabel hoge prijs. Organisaties kunnen ook kiezen voor Hadoop (een platform speciaal ontwikkeld voor big data systemen) of een NoSQL databaseserver, zoals CouchDB, Cassandra en MongoDB. De kans is groot dat veel organisaties in de toekomst een hybride architectuur zullen opbouwen, bestaande uit NoSQL en SQL producten. Rick laat zien hoe deze twee omgevingen samen kunnen functioneren.
Al deze nieuwe technologieën worden tijdens dit seminar kritisch besproken. Voor- en nadelen worden toegelicht en mogelijkheden en technische eigenschappen worden besproken. Na het seminar heeft u een gedegen en compleet overzicht van deze snel veranderende wereld van gegevensopslagtechnologie om big data systemen te ontwikkelen. U zult deze kennis goed kunnen gebruiken om een keuze voor de toekomst te maken.
Deze Powersessie is voor een ieder bestemd die vanuit zijn functie op de hoogte moet blijven van de ontwikkelingen op database- en datawarehousegebied, zoals databasespecialisten, databasebeheerders, datawarehouse- en databaseontwerpers, database-experts, consultants, technology planners, projectleiders en systeemanalisten.
This event takes place at:
Hotel Lapershoek
Utrechtseweg 16
1213 TS Hilversum
The Netherlands
Telephone +31 (0) 35-6231341
For a full itinerary, please see the website of the Amrath Hotel.
The Hotel Lapershoek can also be reached by public transport. Be sure to take the train to ‘Station Hilversum Sportpark’ from which it is only a three minute walk.
Please consult www.9292.nl (door-to-door journey planner, also available in English) or call 0900-9292 (travel advice by phone, € 0.70 p/m).
For attendees interested in an overnight stay, we have made a special price agreement with the hotel. Please let us know if you wish to make use of this.
Taking part in this workshop will only cost 625,50 Euro when registering 30 days beforehand and 695 Euro per person after the Early Bird period expires (excl. 21% Dutch VAT). This also covers documentation, lunch, tea/coffee.
In completing your registration form you declare that you agree with our Terms and Conditions.
Extra discounts
Discounts are available for group bookings of two or more delegates representing the same organization made at the same time. Ten percent off for the second and third delegate and fifteen percent off for all delegates when registering four or more delegates (all delegates must be listed on the same invoice).
This cannot be used in conjunction with other discounts.
Payment
Full payment is due prior to the event. An invoice will be sent to you containing our full bank details including BIC and IBAN. Your payment should always include the invoice number as well as the name of your company and the delegate name.
For Credit Card payment please contact our office by e-mail or through our contact form mentioning your phone number to obtain your credit card information. Never mention your credit card details in our registration form, contact form or in e-mail messages.
Het programma start om 9:30 uur en duurt tot 17:00 uur. Registratie is mogelijk vanaf 8:30 uur.
Ontvangst, registratie en uitreiking documentatie
1. De komst van Big Data en Fast Data
• Nieuwe BI-vormen, waaronder data science, investigative analytics en streaming analytics
• Het inzetten van Big Data om een concurrentievoordeel te krijgen
• Verschillen tussen semi-structured, poly-structured, multi-structured en unstructured data
• Voorbeelden van Big Data: sensordata, (micro-)eventdata en clickstream data
• Fast Data = Big Data + fast analytics + fast reactions
• Het belang van meer schaalbaarheid en query performance
2. De wereld van Hadoop, NoSQL en Spark toegelicht
• De Hadoop stack: HDFS, MapReduce, Hive, Spark, HBase, YARN, ZooKeeper, Pig, HCatalog, enzovoorts
• Alternatieve implementaties onder andere van MapR, Amazon (Hadoop as a service) en ScaleOut (Hadoop in-memory)
• MapReduce of Spark voor analytics en reporting?
• Classificatie van NoSQL producten: key-value stores, document stores, column-family stores en graph data stores
• Marktoverzicht, inclusief Apache HBase, Cassandra, CouchDB, Cloudera, DataStax, MongoDB, Neo4j en Riak
3. Big SQL oplossingen: SQL-on-Hadoop, NewSQL en analytical SQL databaseservers
• Hoe volwassen zijn de huidige SQL-on-Hadoop oplossingen?
• Marktoverzicht van SQL-on-Hadoop engines, inclusief Apache Drill, Apache Hive, Apache Phoenix, Cloudera Impala, HP Vertica, JethroData, Spark SQL en Splice Machine
• Classificatie van analytical SQL databaseservers
• De voor- en nadelen van kolomgebaseerde opslagstructuren
• Wat is in-database analytics en wat is de relatie met Google’s MapReduce?
• Marktoverzicht, inclusief Apache Greenplum, Exasol, HP Vertica, IBM PureData Systems for Analytics, InfoBright, JustOneDB, Kognitio WX2, Microsoft PDW, Oracle In-Memory, SAP HANA en Sybase IQ, SnowflakeDB, Teradata Appliances en Teradata Aster Database
• NewSQL betekent high-performance transactie-georiënteerde SQL systemen
• Simpelere transactiemechanismen om scale-out te realiseren
• Het voorkomen van multi-table joins die niet geparallelliseerd kunnen worden
• Marktoverzicht inclusief Akiban, Clustrix, GenieDB, NuoDB en VoltDB
4. Technologieën voor Fast Data en streaming analytics
• De grootste toepassing van Fast Data: het Internet of Things (IoT)
• IoT betekent streaming data en snel analyseren van die data
• IoT devices: Smartphones (horloges), RFID sensoren, machines, algemene sensoren, cameras, pace makers, enzovoorts
• De uitdaging: real-time reacties op streaming data
• De verschillen tussen Big Data en fast Big Data
• Technologieën voor streaming data: Apache Kafka, Apache ActiveMQ, Amazon Kinesis, Kestrel, RabbitMQ en ZeroMQ
• Verschillen tussen de nieuwe technologieën en traditionele message queuing producten
• Voorbeelden van producten voor Big Data streaming: Apache Storm en Flink, IBM InfoSphere Streams, Informatica for Streaming Analytics, Software AG Apama en Spark Streaming
• Hoe integreren we Fast Data met het enterprise data warehouse?
5. Integreren van Big Data technologie in datawarehouse systemen
• Gebruiken van Hadoop en Spark in datawarehouse systemen
• Hadoop als staging area, datawarehouse, data mart of archiveringsgebied
• Datawarehouse gegevens beschikbaar stellen voor rapportage en analyse met SQL-on-Hadoop engines
• Gebruik van datavirtualisatie om gegevens te integreren die opgeslagen zijn in Hadoop, NoSQL- en SQL-systemen
• De mogelijke rol van NoSQL
6. Ontwikkelen van data lakes met Big Data technologie
• Wat is een data lake?
• Welke technologieën zijn geschikt voor het ontwikkelen van data lakes?
• Is het realistisch om een fysiek data lake op te bouwen met Big Data?
• Het ontwikkelen van een virtueel of logisch data lake met datavirtualisatie-servers
• Let op de technische en business metadata!
7. Data Science, Big Data Technologie en het datawarehouse
• Wat is data science en waarom is het anders dan analytics?
• Wat hebben MapReduce en Spark data scientists te bieden?
• Kunnen we standaard BI tools, zoals QlikView en Tableau, gebruiken in samenwerking met Spark?
• Hadoop als sandbox voor geavanceerde vormen van analytics
• De waarde van graph databases voor data science, zoals AllegroGraph, InfiniteGraph en Neo4J
8. Samenvatting en afsluiting
Practically all of our seminars and workshops can be offered as an In-house course for your company exclusively. We can tailor with extra focus on specific topics that apply to your organization. Also available in online format or in face-to-face format with live video stream.
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office