Toute l'actualité du Bigdata et surtout de sa communauté francophone dans un podcast.
Episode 176 : Il n'y a pas que les modèles qui hallucinent
### LLM fever* Kyutai, le laboratoire d'intelligence artificielle en mode science ouverte -> https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/kyutai-le-laboratoire-d-intelligence-artificielle-en-mode-science-ouverte-qui-veut-concurrencer-les-gafam_175123* ChatGPT Réinventé: comment le faire philosopher pour améliorer ses résultats -> https://generationia.flint.media/p/step-back-prompting-reculer-pour-mieux-sauter* Microsoft optimise Azure avec ses propres puces d’IA -> https://www.actuia.com/actualite/microsoft-optimise-azure-avec-ses-propres-puces-dia/### Data-eng* data load tool (dlt) -> https://dlthub.com/* Microsoft and Google join forces on OneTable, an open-source solution for data lake challenges -> https://venturebeat.com/data-infrastructure/exclusive-microsoft-and-google-join-forces-on-onetable-an-open-source-solution-for-data-lake-chall
27/11/2023 • 51 minutes 26 seconds
Episode 175 : Evaluateur de LLM
* Why can't datacenter operators stop thinking about atomic power? -> https://www.theregister.com/2023/09/27/datacenters_nuclear_power### LLM fever* Evaluate LLMs and RAG a practical example using Langchain and Hugging Face -> https://www.philschmid.de/evaluate-llm* Introducing the Giskard Bot: Enhancing LLM Testing & Debugging on Hugging Face -> https://huggingface.co/blog/JMJM/giskard-llm-testing-and-debugging-hf* Introducing Canopy: An easy, free, and flexible RAG framework powered by Pinecone -> https://www.pinecone.io/blog/canopy-rag-framework/### Tools* Pijul -> https://pijul.org/* Pijul la théorie -> https://pijul.org/manual/theory.html### meetup* "Ou va la modern Data Stack ?" le 31 janvier 2024 chez Criteo -> https://www.linkedin.com/company/modern-data-stack-france/------------------Cette publication est spons
20/11/2023 • 42 minutes 59 seconds
Episode 174 : OpenAI devday 2023
* ⚠️ Don't try this at home: CSS _as_ the backend - introducing Cascading Server Sheets! -> https://dev.to/thormeier/dont-try-this-at-home-css-as-the-backend-what-3oih### LLM fever* Open AI Dev day 2024 -> https://openai.com/blog/new-models-and-developer-products-announced-at-devday* Knowledge Distillation: Principles, Algorithms, Applications -> https://neptune.ai/blog/knowledge-distillation* Quand la boîte noire des IA génératives livre ses secrets -> https://www.lexpress.fr/amp/economie/high-tech/quand-la-boite-noire-des-ia-generatives-livre-ses-secrets-BFUANKGCOZF2DDGJRNFDNAVHZU/### Data-Science* Hidden Markov Models Explained with a Real Life Example and Python code -> https://medium.com/towards-data-science/hidden-markov-models-explained-with-a-real-life-example-and-python-code-2df2a7956d65### Data-eng* Open Data Contract Standard -> https://github.c
13/11/2023 • 49 minutes 12 seconds
Episode 173 : L'arbre qui cache la forêt aléatoire
### Data-science* XGBoost 2.0: New Tool for Training Better AI Models on More Complex Data -> https://aibusiness.com/ml/xgboost-2-0-new-tool-for-training-better-ai-models-on-more-complex-data* Semantic link in Microsoft Fabric: Bridging BI and Data Science -> https://blog.fabric.microsoft.com/en-us/blog/semantic-link-use-fabric-notebooks-and-power-bi-datasets-for-machine-learning-data-validation-and-more* Mastering Customer Segmentation with LLMs -> https://towardsdatascience.com/mastering-customer-segmentation-with-llm-3d9008235f41### Tools* ELT with Meltano (PostgreSQL -> Snowflake) -> https://medium.com/@danthelion/elt-with-meltano-postgressql-snowflake-a543c077ae1a* Fast, Git Friendly API Client -> https://www.usebruno.com------------------Cette publication est sponsorisée par <a href="https://affini-tech.com/" target="_bl
30/10/2023 • 48 minutes 12 seconds
Episode 172 : ça souffle toujours sur les LLMs
### LLM fever* Zephyr 7B -> https://www.linkedin.com/posts/lewis-tunstall_heres-a-simple-recipe-to-train-a-7b-model-activity-7117523535991857152-LuYg/?utm_source=share&utm_medium=member_desktop* Bing Chat Enterprise -> Your AI-Powered Chat for Work | Bing Chat Enterprise (microsoft.com)* promptflow -> promptflow/examples/tutorials/e2e-development/chat-with-pdf.md at main · microsoft/promptflow (github.com)* n8n langchain -> https://n8n.io/workflows/1959-ailangchain-ai-chatbot-that-can-query-the-web/### Data-eng* DuckDB Extensions for AWS Lambda -> https://extensions.quacking.cloud/* Build Data Lake Pipelines with Google Pub/Sub -> https://medium.com/illumination/build-data-lake-pipelines-with-google-pub-sub-6ecb8da87c08* Kestra has raised $3 million -> https://www.linkedin.com/posts/ludovic-dehon_opensource-activity-7115612770783350785-6nGr/* Terraform @ scaleway -> https://d
23/10/2023 • 46 minutes
Episode 171 : ChatGPT on lui parle poliment
Linkedin Live avec Paul : Embeddings audio & image avec Serge Retkowsky -> https://www.linkedin.com/events/7101846404389580800/comments/### LLM* First Impressions with GPT-4V(ision) -> https://blog.roboflow.com/gpt-4-vision/* Expanding access to safer AI with Amazon -> https://www.anthropic.com/index/anthropic-amazon* AutoGen: Enabling next-generation large language model applications -> https://www.microsoft.com/en-us/research/blog/autogen-enabling-next-generation-large-language-model-applications/### Cloud* Motherduck (managed DBT) pricing -> https://motherduck.com/pricing/* Real-time Analytics with Snowflake Dynamic Tables & Redpanda -> https://www.arecadata.com/real-time-analytics-with-dynamic-tables-in-snowflake-redpanda/* Announcing BigQuery Omni cross-cloud joins -> https://cloud.google.com/blog/products/data-analytics/announcing-bigquery-omni-
16/10/2023 • 44 minutes 45 seconds
EP170 : le Vent tourne pour les LLM
### LLM* Mistral 7B is here! -> https://mistral.ai/product/* What's going on with the Open LLM Leaderboard? -> https://huggingface.co/blog/evaluating-mmlu-leaderboard* How do I use ChatGPT Browse with Bing to search the web? -> https://help.openai.com/en/articles/8077698-how-do-i-use-chatgpt-browse-with-bing-to-search-the-web* Meta AI assistant uses Microsoft Bing Search results -> https://searchengineland.com/meta-ai-assistant-uses-microsoft-bing-search-results-432565* The iliad Group is making strategic investments in Artificial Intelligence -> https://s3.fr-par.scw.cloud/iliad-strapi/DP_iliad_AI_260923_Eng_462ff3265c.pdf### Cloud and DBs* Announcing DuckDB 0.9.0 -> https://duckdb.org/2023/09/26/announcing-duckdb-090.html* A Guide To The Snowflake Results Cache -> https://teej.ghost.io/a-guide-to-the-snowflake-results-cache/Cette publication est sponsorisée
10/10/2023 • 44 minutes 57 seconds
Episode 169 : LLM est un consultant comme les autres
* Modern Data Stack Meetup : Streamlit + Kestra### Gen AI* Deploy Your LLM Chatbot With Retrieval Augmented Generation (RAG), llama2-70B (MosaicML inferences) and Vector Search -> https://www.databricks.com/resources/demos/tutorials/data-science-and-ai/lakehouse-ai-deploy-your-llm-chatbot?itm_data=demo_center* LLMs in Action: A Practical Guide for Software Architects and Developers -> https://www.linkedin.com/pulse/llms-action-practical-guide-software-architects-s%C3%A9bastien-brasseur?utm_source=share&utm_medium=member_ios&utm_campaign=share_via* Lantern — a PostgreSQL vector database for building AI applications -> https://docs.lantern.dev/blog/2023/09/13/hello-world### Data science* Announcing Python in Excel: Combining the power of Python and the flexibility of Excel. -> https://techcommunity.microsoft.com/t5/excel-blog/announcing-python-in-excel-combining-the-power-of-python-and-the/ba-p/3893439<
19/09/2023 • 1 hour 11 minutes 25 seconds
Episode 168 : Si t'as pas ta vectordb en 2023...
### Tools* Ruff -> https://beta.ruff.rs/docs/### Cloud* Mountpoint for Amazon S3 -> https://aws.amazon.com/blogs/aws/mountpoint-for-amazon-s3-generally-available-and-ready-for-production-workloads/### Time Series* Is Flux being deprecated with InfluxDB 3.0? -> https://community.influxdata.com/t/is-flux-being-deprecated-with-influxdb-3-0/30992/8?u=pauldix* Timeseries dans le podcast AWS en Français -> https://aws.amazon.com/fr/blogs/france/podcasts/### Database* Awesome DuckDB -> https://github.com/davidgasquez/awesome-duckdb### GenAI* RAG vs Finetuning — Which Is the Best Tool to Boost Your LLM Application? -> https://towardsdatascience.com/rag-vs-finetuning-which-is-the-best-tool-to-boost-your-llm-application-94654b1eaba7* Best practices for your ChatGPT ‘on your data’ solution -> https://medium.com/@imicknl/how-to-improve-your-chatgpt-on-your-data-solution-d1e842d87404* OpenAI, ma
05/09/2023 • 1 hour 17 minutes 32 seconds
Episode 167 : Snowflake
Dans cet épisode nous accueillons Ilyes Mehaddi de Snowflake pour nous parler de Snowflake Data Cloud et des annonces du SummitRetrouvez Ilyes sur le slack du bigdatahebdo ou alors sur son blogData Cloud World Tour : 5 octobre à Paris Recap du Summit 2023 par secteurs d’activités Recap des annonces du Summit 2023 SponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.<a href="https://www.cerenit.fr/" target="_blank" rel="noreferrer noope
27/07/2023 • 1 hour 39 minutes 15 seconds
Episode 166 : Databricks Data + AI Summit 2023 avec Quentin Ambard (part 2/2)
Encore une fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverserRetrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/# Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Paul : [@paulpeton](https://twitter.com/paulpeton) et [methodidacte](https://methodidacte.org)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [
24/07/2023 • 42 minutes 10 seconds
Episode 166 : Databricks Data + AI Summit 2023 avec Quentin Ambard (part 1/2)
Encore un fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverserRetrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/# Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Paul : [@paulpeton](https://twitter.com/paulpeton) et [methodidacte](https://methodidacte.org)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [contact
15/07/2023 • 1 hour 11 minutes 8 seconds
Episode 165 : Generative duck phone number
### Apéro* Voxxed Days Luxembourg ->* Numéros pour œuvres audiovisuelles -> https://www.arcep.fr/uploads/tx_gsavis/21-0532.pdf### ML* Gladia -> http://app.gladia.io/* Microsoft Orca 13B -> https://intelligence-artificielle.developpez.com/actu/345575/Microsoft-AI-presente-Orca-un-modele-a-13-milliards-de-parametres-qui-apprend-a-imiter-le-processus-de-raisonnement-des-grands-modeles-fondamentaux-ses-performances-egalent-celles-de-ChatGPT/* Image Joint Embedding Predictive Architecture -> Cette nouvelle IA de Meta serait capable de raisonner comme un humain (clubic.com)* Grounding et RAG -> Grounding LLMs - Microsoft Community Hub* Ask your own data -> https://methodidacte.org/2023/06/ajoutez-vos-donnees-a-chatgpt/### DB* Announcing MotherDuck -> https://motherduck.com/blog/announcing-motherduck-duckdb-in-the-cloud/* Build SQL pipelines to BigQuery with Dataform -> h
08/07/2023 • 59 minutes 33 seconds
Episode 164 : Que fabric santa Nadella ?
Retour sur la MS Build 2023 avec Charles-Henri Sauget MVP Microsofthttps://learn.microsoft.com/en-us/fabric/get-started/microsoft-fabric-overviewSponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélére
29/06/2023 • 1 hour 22 minutes 30 seconds
Episode 163 : On fait de l'informatique pour ne pas avoir à parler aux gens
* Google I/O '23 in under 10 minutes -> https://www.youtube.com/watch?v=hleLlcHwQLM&list=TLGGCy91ScdjTPYyNjA1MjAyMw&index=2* Google "We Have No Moat, And Neither Does OpenAI" -> https://www.semianalysis.com/p/google-we-have-no-moat-and-neither* Google demande à ses chercheurs d'arrêter de partager leurs travaux -> https://www.nextinpact.com/lebrief/71669/google-demande-a-ses-chercheurs-darreter-partager-leurs-travaux* Multilingual speech to text -> https://ai.facebook.com/blog/multilingual-model-speech-recognition/* Tableau Jumps Into Generative AI with Tableau GPT -> https://www.datanami.com/2023/05/09/tableau-jumps-into-generative-ai-with-tableau-gpt/* Sklearn Meets Large Language Models -> https://github.com/iryna-kondr/scikit-llmSponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit
01/06/2023 • 56 minutes 50 seconds
Episode 162 : WARP10 3.0 avec Mathias Herberts
Warp 10 sors dans sa version 3, Mathias Herberts est avec nous pour en parlerQuelques blogs de la société Senx sur Warp 10 : https://blog.senx.io/tag/warp-10-3-x/Mathias était déjà venu nous parler de Warp 10 dans l'épisode 72 (https://bigdatahebdo.com/podcast/episode-72-warp-10-avec-mathias-herberts/)Pour en savoir plus sur Foundation DB il y a l'épisode 93 (https://bigdatahebdo.com/podcast/episode-93-foundation-db/)Suivez Mathias Herberts sur Twitter : [@herberts](https://twitter.com/herberts)
24/05/2023 • 1 hour 38 minutes 41 seconds
Episode 161 : La semaine dernière a été une année importante
### Apéro* Nouveau métier dans l'IA: C3PO -> https://podcast.ausha.co/le-podcast-des-eclaireurs/c3po-ce-metier-qui-va-sauver-les-journalistes### GenAI* Microsoft JARVIS / HuggingGPT -> https://analyticsindiamag.com/microsoft-jarvis-is-the-path-towards-agi/* New ways to manage your data in ChatGPT -> https://openai.com/blog/new-ways-to-manage-your-data-in-chatgpt### Vector DB* What is a Vector Database? -> What is a Vector Database? - Zilliz Vector database learn* Chroma the AI-native open-source embedding database -> https://www.trychroma.com### Cloud* Augmentation Bigquery la suite -> ### Databases* MySQL Locking Reads -> https://vincepergolizzi.com/programming/2020/09/02/mysql-locking-reads.html* CLickhouse -> https://affini-tech.com/blog/clickhouse/
09/05/2023 • 1 hour 15 minutes 3 seconds
BigdataHebdo Live à DevoxxFR 2023
Merci à l'équipe DevoxxFR de nous avoir accueilli pour cet enregistrementMerci à nos auditeurs qui nous ont rejoins, pour leur contributions et leur bonne humeur.
01/05/2023 • 48 minutes 9 seconds
EP159 : Il n'y a pas que ChatGPT
### Apero* JChateau -> https://www.jchateau.org/### IA Generatives* GPT4 -> "* ChatGPT : L'ère de l'IA a commencé !(phil_it avec la participation de Paul Péton) -> https://youtu.be/P-1sONuhNnQ"* Hello Dolly: Democratizing the magic of ChatGPT with open models -> https://www.databricks.com/blog/2023/03/24/hello-dolly-democratizing-magic-chatgpt-open-models.html* Microsoft licencie son équipe en charge de l’éthique sur l’IA -> https://www.nextinpact.com/lebrief/71230/microsoft-licencie-son-equipe-dediee-a-lethique-lia### Databases* New UUID Formats -> https://uuid6.github.io/uuid6-ietf-draft/* A Universally Unique IDentifier (UUID) URN Namespace -> https://www.ietf.org/archive/id/draft-ietf-uuidrev-rfc4122bis-00.html* Snowflake Micro-partitions & Table Clustering -> https://medium.com/snowflake/snowflake-micro-partitions-table-clustering-74beabaf780f* Event driven archite
11/04/2023 • 1 hour 24 minutes 24 seconds
Episode 158 : Si tu n'existes pas dans Chat GPT, tu n'existes pas
Apero* Des soldats trompent des robots avec une ruse de Metal Gear Solid -> https://www.numerama.com/pop-culture/1244300-des-soldats-trompent-des-robots-avec-une-ruse-de-metal-gear-solid.html### IA Generatives* Reinforcement Learning with Human Feedback -> https://huggingface.co/blog/rlhf* La délicate question du sous-traitement des données d'entraînement de l'IA -> https://www.nextinpact.com/article/70384/la-delicate-question-sous-traiter-donnees-dentrainement-lia?utm_source=pocket_reader### Database (DBT) * Announcing DuckDB 0.7.0 -> https://duckdb.org/2023/02/13/announcing-duckdb-070.html* Est ce que vous avez des bigdata (bigdata is dead par jordan tigrani) ? -> https://motherduck.com/blog/big-data-is-dead/* dbt Labs Signs Definitive Agreement to Acquire Transform, Accelerating Development of the dbt Semantic Layer -> https://www.prnewswire.com/news-releases/dbt-labs-signs-definitive-agr
09/04/2023 • 1 hour 6 minutes 20 seconds
Episode 157 : ML avec OVH Cloud
Cette semaine on parle de ML avec OVH CloudComment OVH Cloud étoffe sa gamme deservice pour répondre aux challenges du ML dans le Cloud.AI Machine Learning @ OVHhttps://www.ovhcloud.com/fr/public-cloud/ai-machine-learning/Workshop écrit par Bastien pour travailler avec DBT sur OVH Cloudhttps://dbt-postgresql-metabase-workshop.pages.dev/ Invités :Elea Petton@eleapettonhttps://www.linkedin.com/in/elea-petton/Bastien Verdebout@BastienOvhhttps://www.linkedin.com/in
30/03/2023 • 1 hour 21 minutes 55 seconds
Episode 156 : Quickwit avec Paul Masurel et François Massot
Episode spécial Quickwit Quickwit https://quickwit.io/avec Paul Masurel (https://twitter.com/fulmicoton) et François Massot (https://twitter.com/FrancoisMassot)
12/03/2023 • 1 hour 17 minutes 16 seconds
Episode 155 : Bilan et prédictions de début d'année (en retard)
OrateursAlexander : @alexanderdejaJérôme : @jxerome et ZeeneaNicolas: @nsteinmetz, CerenIT, Paris Time Series MeeupVincent : @vhe74, Affini-Tech et DatataskPaul : @paulpetonSponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Paris Time Series Meetup.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask)Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
11/03/2023 • 1 hour 13 minutes 57 seconds
Episode 154 : Re-Invente moi des histoires
### Apero* Paul tu nous reserves une petite anecdote sur le monde IT -> * Le podcast AWS en français AWS re:Invent re:Cap (136, 137, 138) -> https://aws.amazon.com/fr/blogs/france/podcasts/* The best UUID type for a database Primary Key -> https://vladmihalcea.com/uuid-database-primary-key/* TSID Creator -> https://github.com/f4b6a3/tsid-creator### ML* Manage Azure Machine Learning registries -> https://learn.microsoft.com/en-us/azure/machine-learning/how-to-manage-registries?tabs=cli### AI* Meta débranche Galactica, IA génératrice de textes scientifiques -> https://www.lebigdata.fr/raciste-folle-ia-meta-galactica#:~:text=L'IA%20Galactica%20de%20Meta,web%20scientifiques%20et%20d'encyclop%C3%A9dies.* Meta AI présente CICERO, un agent d’IA capable de négocier et coopérer avec les humains -> https://www.actuia.com/actualite/meta-ai-presente-cicero-un-agent
07/02/2023 • 1 hour 8 minutes 51 seconds
Episode 153 : Couchbase avec Laurent Doguin
Couchbase avec Laurent DoguinEssayez Couchbase sur Capella https://cloud.couchbase.comOu le playground https://couchbase.live/Ou dans Gitpod avec du GraphQL https://gitpod.io/#https://github.com/ldoguin/couchbase-graphql-travelVenez nous voir sur Discord: https://discord.gg/jJfT4pDU6zOn reprend les meetups https://www.meetup.com/couchbase-france/ML Meets NoSQL: Integrating Python User-Defined Functions with N1QL for Analyticshttps://www.couchbase.com/blog/ml-meets-nosql-integrating-python-user-defined-functions-with-n1ql-for-analytics/On recrute https://www.couchbase.com/careers/open-positions
20/12/2022 • 1 hour 34 minutes 19 seconds
Episode 152 : pour quelques secondes d'assembleur de plus
### Apero* RIP: Kathleen Booth, the inventor of assembly language -> https://www.theregister.com/2022/10/29/kathleen_booth_obit/### Database * Announcing DuckDB 0.6.0 -> https://duckdb.org/2022/11/14/announcing-duckdb-060.html* MotherDuck secures investment from Andreessen Horowitz to commercialize DuckDB -> https://techcrunch.com/2022/11/15/motherduck-secures-investment-from-andreessen-horowi
08/12/2022 • 1 hour 9 minutes 49 seconds
Episode 151 : Nicolas @ Flovea et quelques News
### Flovea### Time Series* Welcome to InfluxDB IOx: InfluxData’s New Storage Engine -> https://www.influxdata.com/blog/influxdb-engine/### Big Data* Mort d’Hadoop : le marché se trompe selon le TOSIT -> https://www.lemagit.fr/actualites/252525812/Mort-dHadoop-une-affirmation-prematuree-selon-le-TOSIT### DBT* Coalesce 2022 : dbt Semantic Layer -> https://www.prnewswire.com/news-releases/dbt-labs-launches-the-dbt-semantic-layer-enabling-greater-consistency-across-analytics-tools-301652226.html* Coalesce 2022 : replays -> <a href="https://www.youtube.c
05/12/2022 • 1 hour 15 minutes 54 seconds
Episode 150 : l'histoire de ce Podcast et Datatask
L'équipe interview Vincent Heuschling pour revenir sur ces années de Podcast et présenter la plateforme DatataskSponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](<a href="http://affini-tech.com" rel="noope
22/11/2022 • 1 hour 22 minutes 10 seconds
Episode 149 : vos données sont tabulaires, ne faites pas de Deep Learning
### Apéro* Retour Bigdata Paris* Retour Salon Data Nantes * We Spoke With the Last Person Standing in the Floppy Disk Business -> https://eyeondesign.aiga.org/we-spoke-with-the-last-person-standing-in-the-floppy-disk-business/### Database tooling* Adding Data Observability and Alerts to your Data Pipeline is easier than you think -> https://blog.infuseai.io/adding-data-observability-and-alerts-to-your-data-pipeline-is-easier-than-you-think-4e005daca55b* Monitor your dbt tests results and add Elementary anomaly detection tests to your dbt project. -> https://github.com/elementary-data/elementary</a
30/09/2022 • 1 hour 15 minutes 22 seconds
Episode 148 : Trino avec Victor Coustenoble
On reçoit cette dans cet épisode Victor Coustenoble pour nous parler de Trino.Rebranding PrestoSQL as Trino https://trino.io/blog/2020/12/27/announcing-trino.htmlHappy tenth birthday Trino!https://trino.io/blog/2022/08/08/trino-tenth-birthday.htmlTrino's tenth birthday celebration recaphttps://trino.io/blog/2022/09/12/tenth-birthday-celebration-recap.htmlA decade of query engine innovationhttps://trino.io/blog/2022/08/04/decade-innovation.htmlOrateursVictor : @victorcousteAlexander : @alexanderdejaVincent : @vhe74, Affini-Tech et Datat
22/09/2022 • 1 hour 15 minutes 13 seconds
Episode 147 : Small data and MLops stacks
### Apéro* CVE-2022-38392 -> https://cve.mitre.org/cgi-bin/cvename.cgi?name=CVE-2022-38392* Une chanson de Janet Jackson reconnue officiellement comme un malware -> https://www.01net.com/actualites/une-chanson-de-janet-jackson-reconnue-officiellement-comme-un-malware.html* AI Images: Last Week Tonight with John Oliver (HBO) -> https://youtu.be/3YNku5FKWjw* Demystifying the Parquet File Format | by Michael Berk -> https://towardsdatascience.com/demystifying-the-parquet-file-format-13adb0206705* dbt Constraints: Automatic Primary Keys, Unique Keys, and For
19/09/2022 • 1 hour 29 minutes 4 seconds
Episode 146 : Cassandra met tout le monde d'Accord
### Apéro* La reco série TV: WeCrashed sur Apple TV+ -> https://tv.apple.com/fr/show/wecrashed/umc.cmc.6qw605uv2rwbzutk2p2fsgvq9?ctx_brand=tvs.sbd.4000&gclid=Cj0KCQjwlemWBhDUARIsAFp1rLXJzK2SztU23aO4k_R_ZwVSorf5fiXgFTn6SncUQNkDs1A2DK8XHwcaAhgCEALw_wcB&ign-itscg=MC_20000&ign-itsct=atvp_brand_omd&mttn3pid=Google%20AdWords&mttnagencyid=a5e&mttncc=FR&mttnsiteid=143238&mttnsubad=OFR2019932_1-597325122921-c&mttnsubkw=136987586634__l5XJ5eA5_&mttnsubplmnt=* Hitler uses Kubernetes -> https://youtu.be/9wvEwPLcLcA</
26/07/2022 • 1 hour 38 minutes 16 seconds
Episode 145 : Databricks Data + AI Summit 2022
Retrouver les conférences du summit https://databricks.com/dataaisummit/---------SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Te
26/07/2022 • 1 hour 42 minutes 48 seconds
Episode 144 : DALL-E pour torpiller la productivité
### Apero* Les pires réalisations de DALL-E (2 ou version mini ?) -> https://huggingface.co/spaces/dalle-mini/dalle-mini* HOW DALL-E COULD POWER A CREATIVE REVOLUTION -> https://www.theverge.com/23162454/openai-dall-e-image-generation-tool-creative-revolution### Database* Introducing Unistore, Snowflake’s New Workload for Transactional and Analytical Data -> https://www.snowflake.com/blog/introducing-unistore/* Snowflake summit 2022 -> https://www.montecarlodata.com/snowflake-summit-2022-keynote-recap-disrupting-data-applica
07/07/2022 • 1 hour 23 minutes 30 seconds
Episode 143 : Bases de données DIY ou pas ?
### Apero* La reco série TV: The Dropout sur Disney+ -> https://www.disneyplus.com/fr-fr/series/the-dropout/5C0gjGwyRTeZ* Store files as YouTube videos == infinite disk space -> https://github.com/dzhang314/YouTubeDrive### Database"* AlloyDB for PostgreSQL under the hood -> https://cloud.google.com/blog/products/databases/alloydb-for-postgresql-columnar-engine/https://cloud.google.com/blog/products/databases/alloydb-for-postgresql-intelligent-scalable-storage"* Let's build a distributed Postgres proof of concept -> <a href="https://notes.e
07/07/2022 • 1 hour 21 minutes 34 seconds
Episode 142 : Le navigateur c'est l'avenir
### Apero* Run Python code in your HTML -> https://pyscript.net/* Comment son micro-ondes intelligent a tenté de le tuer -> https://www.ladn.eu/mondes-creatifs/ia-youtubeur-micro-onde-intelligent-psychopathe/?utm_source=pocket_mylist* I gave my microwave a soul with AI and it tried to kill me -> https://youtu.be/C1G5b_2PYj0### Database* Introducing AlloyDB for PostgreSQL: Free yourself from expensive, legacy databases -> https://cloud.google.com/blog/products/databases/introducing-alloydb-for-postgresql* Snowflake Time Travel and Fail-safe -> <a href="https://piariachi.medium.com/snowflake-
### L'apéro* Le debrief de Devoxx 2022 -> https://www.devoxx.fr/### Cloud* Announcing General Availability of Change Data Capture (CDC) on Azure SQL Database -> https://techcommunity.microsoft.com/t5/azure-sql-blog/announcing-general-availability-of-change-data-capture-cdc-on/ba-p/3284280* Announcing Gated Public Preview of Unity Catalog on AWS and Azure -> https://databricks.com/blog/2022/04/20/announcing-gated-public-preview-of-unity-catalog-on-aws-and-azure.html### Cloud Native* Enterprises using more Kubernetes across more clouds, but continue to find it challenging: report -> <a href="https:
15/05/2022 • 1 hour 13 minutes 14 seconds
Episode 140 : Feature importance de la mafia dans la data
### Apero* Atlassian a effacé les environnements cloud de 400 clients par erreur -> https://www.usine-digitale.fr/article/atlassian-a-efface-les-environnements-cloud-de-400-clients-par-erreur.N1993357* Hacked News Channel and Deepfake of Zelenskyy Surrendering Is Causing Chaos Online -> https://www-vice-com.cdn.ampproject.org/c/s/www.vice.com/amp/en/article/93bmda/hacked-news-channel-and-deepfake-of-zelenskyy-surrendering-is-causing-chaos-online### Database* PostgreSQL interface -> https://cloud.google.com/spanner/docs/postgresql-i
13/05/2022 • 1 hour 26 minutes 53 seconds
Episode 139 : Des relations en profondeur de 7 à 77 ans
### Apero* servAtem mise tout sur le 7 ! -> https://www.lemonde.fr/blog/binaire/2022/04/01/servatem-mise-tout-sur-le-7/### Database* Making Real-Time Data Real: Change Data Capture for Astra DB -> https://thenewstack.io/making-real-time-data-real-change-data-capture-for-astra-db/https://github.com/datastax/cdc-apache-cassandra* Unite your data and get a highly scalable, performant, native GraphQL graph database in the cloud that delivers blazingly fast query speeds. -> https://dgraph.io/### ML/AI* Deep Learning Is Hitting a Wall -> <a href="https://nautil.us/deep-learning-is-hitting-a-wall-14467
06/05/2022 • 1 hour 8 minutes 57 seconds
Episode 138 : Les gentils Cloud, la CNIL et F***DB
### La rubrique de l'indien* CVE-2021-44521 – Exploiting Apache Cassandra User-Defined Functions for Remote Code Execution -> https://jfrog.com/blog/cve-2021-44521-exploiting-apache-cassandra-user-defined-functions-for-remote-code-execution/### Cloud* AWS devriendrait-il gentil? -> https://www.elastic.co/blog/elastic-and-amazon-reach-agreement-on-trademark-infringement-lawsuit* AWS devriendrait-il gentil? -> https://venturebeat.com/2022/03/15/mongodb-and-aws-go-deep-to-help-customers-move-to-the-cloud/### Cloud Native* Kubernetes is complex because
29/04/2022 • 1 hour 1 minute 25 seconds
Episode 137 : Cloud native intermittent developer
### Apero* A short history of the O’Reilly animals https://trkit.io/s/BDHEP137JWbM ### La rubrique de l'indien* The Apache Software Foundation Announces Open Source data orchestration platform Apache® Hop™ as a Top-Level Project https://trkit.io/s/BDHEP137wV2V ### Cloud Native* Clever Operator: The best of Kubernetes and Clever Cloud https://trkit.io/s/BDHEP137KKhZ * A Kubernetes Documentary Shares Google’s Open Source Story https://trkit.io/s/BDHEP137Wa5e ### Data-Gouv* open-metadata Open Standard for Metadata https://trkit.io/s/BDHEP137gMn0 ### Search engines & databases*
25/03/2022 • 52 minutes 49 seconds
Episode 136 : Il y a t'il un copilot devant le clavier ?
------Apéro The Apache Software Foundation Bloghttps://trkit.io/s/BDHEP136wxdwAWS owns $2.5 billion of IPv4 addresseshttps://trkit.io/s/BDHEP136eiDPComment utiliser IPv6 dans le cloud/AWS ?https://trkit.io/s/BDHEP1360tpQ------Tools7 Promising VS Code Extensions Introduced in 2021https://trkit.io/s/BDHEP136bCXQREST Client — Extension VSCode https://trkit.io/s/BDHEP136vcuQIntelligence artificielle : L’assistant GitHub Copilot réduit d’un tiers le travail des développeurshttps://trkit.io/s/BDHEP1369afo</
21/03/2022 • 1 hour 33 minutes 53 seconds
Episode 135 : La Data dans Kubernetes avec Jérôme Petazzoni
Un épisode thématique enregistré le 07/01/2022 avec Jérome Petazzoni et Julien Laurenceau. Nous faisons le point sur la gestion de la data dans Kubernetes.Shownotes complètes sur : https://trkit.io/s/BDHEP135
22/02/2022 • 2 hours 3 minutes 46 seconds
Episode 134 : Merry X-Mas les coquinous !
Episode 134 : Merry X-Mas les coquinous !Un épisode de fin d'année et de news enregistré le 22/12/2021.avec Vincent Heuschling, Jérôme Mainaud, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP134
23/12/2021 • 1 hour 13 minutes 20 seconds
Episode 133 : IaaS qu'il faut et plus encore en serverless
Episode 133 : IaaS qu'il faut et plus encore en serverlessUn épisode de news enregistré le 10/12/2021.avec Alexander Dejanovski, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP133
17/12/2021 • 1 hour 22 minutes 44 seconds
Episode 132 : Le No-Code est-il compatible avec le RegistryOps ?
Episode 132 : Le No-Code est-il compatible avec le RegistryOps ?Un épisode de news enregistré le 26/11/2021.avec Vincent Heuschling, Jérôme Mainaud, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP132
10/12/2021 • 1 hour 25 minutes 6 seconds
Episode 131 : big data à 230 kb/s
Episode 131 : big data à 230 kb/sPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 12/11/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP131
03/12/2021 • 1 hour 47 minutes 47 seconds
Episode 130 : Du DevSecOps administrativement souverain
Episode 130 : Du DevSecOps administrativement souverainPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 15/10/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP130
22/11/2021 • 1 hour 56 minutes 27 seconds
Episode 129 : Tant qu'il IA du SQL
Un épisode de news enregistré le 01/10/21 par Vincent Heuschling, Jérôme Mainaud, et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP129
31/10/2021 • 1 hour 24 minutes 45 seconds
Episode 128 : Infinidash 4.0
Un épisode de news enregistré le 17/09/21 par Vincent Heuschling, Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP128
24/09/2021 • 1 hour 26 minutes 23 seconds
Episode 127 : Pour quelques dollars de plus...
Un épisode de News enregistré le 10 sept 2021 On y parle de Docker, de Serverless, de grosses poignées de dollars, de bases de données, et de processeurs. Shownotes complètes sur : https://trkit.io/s/BDHEP127
20/09/2021 • 1 hour 22 minutes 23 seconds
Episode 126 : Indexima, SQL, ML & optimisation
Un épisode thématique enregistré le 16/07/2021. Nous recevons Nicolas Korchia pour nous parler d'Indexima. Indexima optimise les requêtes SQL entre les outils de Dataviz ou de BI et les Cloud data warehouses. Shownotes complètes sur : https://trkit.io/s/BDHEP126
25/07/2021 • 1 hour 27 minutes 34 seconds
Episode 125 : Azure avec Julien Dubois
Un épisode thématique enregistré le 02/07/2021. Nous recevons Julien Dubois, Java Developer Advocacy manager chez Microsoft.Shownotes complètes sur : https://trkit.io/s/BDHEP125
14/07/2021 • 2 hours 8 minutes 27 seconds
Episode 124 : Ultra bleu ou vert, c'est selon
Un épisode de news enregistré le 18/06/21 par Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP124
02/07/2021 • 1 hour 42 minutes 54 seconds
Episode 123 : Data+AI Summit avec Quentin Ambard
Data+AI Summit avec Quentin Ambard de DatabricksEnregistré le 4/6/2021 par Quentin Ambard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP123
23/06/2021 • 1 hour 8 minutes 27 seconds
Episode 122 : Le défi de la data dans le monde de la voile
Le défi de la data dans le monde de la voileEnregistré le 26/03/2021 par Olivier Douillard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP122
11/06/2021 • 1 hour 23 minutes 17 seconds
Episode 121 : Le défi de la data chez les experts comptables
Le défi de la data chez les experts comptablesEnregistré le12/03/2021 par Fabrice Heuvrard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme MainaudShownotes complètes sur : https://trkit.io/s/BDHEP121
31/05/2021 • 1 hour 16 minutes 12 seconds
Episode 120 : 50 ans de FTP et toujours pas à la retraite
50 ans de FTP et toujours pas à la retraiteEnregistré le 07/05/2021 par Vincent Heuschling, Nicolas Steinmetz, et Jérôme MainaudShownotes complètes sur : https://trkit.io/s/BDHEP120
16/05/2021 • 1 hour 55 minutes 27 seconds
Episode 119 - Le Cloud Native Developper fait-il autre chose que du Kubernetes ?
Cloud Native Developper !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérôme Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP119
16/04/2021 • 1 hour 45 minutes 48 seconds
Episode 118 : Excel, à fond la fonction
Excel, à fond la fonction !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP118
18/02/2021 • 1 hour 55 minutes 57 seconds
Episode 117 : AWS avec Sébastien Stormacq
L'offre AWS avec les annonces "data" de Re-Invent 2020 par Sébastien StormacqEnregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP117
07/02/2021 • 1 hour 51 minutes 9 seconds
Episode 116 : Powerpoint la bdd du futur
Powerpoint la base de données du futur !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP116
19/01/2021 • 1 hour 44 minutes 9 seconds
Episode 115 : CentOS est mort, vive CentOS
CentOS est mort, vive CentOS !Enregistré le 18/12/2020 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaudet Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP115
15/01/2021 • 1 hour 36 minutes 25 seconds
Episode 114 : Bientôt un abonnement pour écouter BigData Hebdo ?
Bientôt un abonnement pour écouter BigData Hebdo ?Episode de News enregistré le 4/12/2020 par Nicolas Steinmetz, Jérôme Mainaud, Alexander Dejanovski, et Vincent Heuschling Shownotes complètes sur : https://trkit.io/s/BDHEP114
31/12/2020 • 1 hour 46 minutes
Episode 113 : Data Catalog et Data Discovery
Un épisode thématique sur le data catalog, la data discovery et la gouvernance des données, enregistr é le 20/11/20 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud, Sandrine Bernaud de Zeenea, et Sylvain L.Shownotes complètes sur : https://trkit.io/s/BDHEP113
27/12/2020 • 1 hour 35 minutes 21 seconds
Episode 112 : Dans le radar des cool vendors
Dans le radar des cool vendorsEpisode de News enregistré le 06/11/2020 par Nicolas Steinmetz et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP112
02/12/2020 • 1 hour 20 minutes 56 seconds
Episode 111 : L'AI à 60 dollars
L'AI à 60 dollarsEpisode de News enregistré le 23/10/2020 par Alexander Dejanovski, Jérôme Mainaud, et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP111
28/11/2020 • 1 hour 39 minutes 11 seconds
Episode 110 : Du SQL à toutes les sauces
Du SQL à toutes les saucesEpisode de News enregistré le 9/10/2020 par Nicolas Steinmetz, Jérôme Mainaud, et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP110
12/10/2020 • 1 hour 39 minutes 11 seconds
Episode 109 : Un bras ça coute cher ...
Un bras ça coute cher, mais pas autant qu'un flocon....Episode de News enregistré le 25/9/2020 par Nicolas Steinmetz, Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP109
11/10/2020 • 1 hour 39 minutes 11 seconds
Episode 108 : Azure Synapse
Azure synapse AnalyticsEnregistré le 11 septembre 2020 avec Fabien Adato et Paul Peton , Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP10!
13/09/2020 • 1 hour 39 minutes 11 seconds
Episode 107 : 100 millions sinon rien
Quelques news de rentréeEnregistré le septembre 2020 avec Alexander Dejanovski, Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP107a
07/09/2020 • 1 hour 36 minutes 33 seconds
Episode 106 : Hadoop et Cloudera, hier, aujourd'hui et demain
Quelques news pour l'étéEnregistré le 24 Juillet 2020 avec Denis Fraval, Laurent Edel, Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP106
18/08/2020 • 1 hour 36 minutes 33 seconds
Episode 105 : summer news
Quelques news pour l'étéEnregistré le 10 Juillet 2020 par Vincent Heuschling , Jérôme Mainaud, Nicolas Steinmetz, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP105
14/08/2020 • 1 hour 18 minutes 12 seconds
Episode 104 : Spark 3
Une interview sur Apache Spark 3 enregistrée le 26 juin 2020Shownotes complètes sur : https://trkit.io/s/BDHEP104
10/08/2020 • 1 hour 9 minutes 9 seconds
Episode 103 : Consul
Une interview sur Consul enregistrée le 12 juin 2020Shownotes complètes sur : https://trkit.io/s/BDHEP103aAffini-Tech sera présent le 14 et 15 septembre 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Pierre Souchay : [@vizionr](https://twitter.com/vizionr)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)<br
15/07/2020 • 1 hour 15 minutes 40 seconds
Episode 102 : La data dans l'entreprise 4.0
Shownotes détaillées : https://trkit.io/s/BDHEP102La data dans l'entreprise 4.0, ou comment la data révolutionne l'industrie.Décriptage d'un mouvement de fond avec Laurent Laporte de Braincube.Pour suivre Laurent Laporte : https://www.linkedin.com/in/laurentlaporte/et Braincube : https://www.linkedin.com/company/braincubefr/ou https://braincube.com/Affini-Tech sera présent le 27 et 28 mai 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Vincent : [@vhe74](
02/07/2020 • 56 minutes 23 seconds
Episode 101 : soit 5 en binaire
Shownotes complètes sur : https://trkit.io/s/BDHEP101 Affini-Tech sera présent le 14 et 15 septembre 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.co
21/06/2020 • 1 hour 19 minutes 52 seconds
Episode 100 : Anniversaire avec la communauté
Shownotes complètes sur : https://trkit.io/s/BDHEP100 Affini-Tech sera présent le 27 et 28 mai 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe7
04/06/2020 • 3 hours 9 minutes 46 seconds
Episode 99 : Apache Pulsar et Kafka on Pulsar
On parle de Apache Pulsar et Kafka on Pulsar avec nos invitésShownotes complètes sur : https://trkit.io/s/BDHEP99Steven : https://twitter.com/GwinizDuPierre : https://twitter.com/PierreZQuentin : https://twitter.com/waxzceVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome-
06/05/2020 • 1 hour 19 minutes 58 seconds
Episode 98 : Datastax, le retour à la communauté ?
Shownotes complètes sur : https://trkit.io/s/BDHEP98Cedrick Lunven et Alexander Dejanovski nous parlent du rachat de the last pickle par Datastax* The Last Pickle Joining DataStax https://trkit.io/s/BDH-HecICs* Des Workshop online tous les mercredis (celui la jeudi)https://trkit.io/s/BDHBFNBJeCA* Posez vos questions à la communautéhttps://trkit.io/s/BDHdqLRTZpH* FF4J le projet OSS de Cedrick https://trkit.io/s/BDHUImVCBxr### Meetups et conférences Bigdatapero en stand by et probablement en remote Bigdata Paris 27 et 28 Mai Affini-Tech sera présen
06/04/2020 • 1 hour 19 minutes 9 seconds
Episode 97 : Aller sur Mars est plus facile que calculer sa facture AWS
-------------------------------------------------------------TimeseriesLes propriétés d'une TSDBhttps://bigdatahebdo.slack.com/archives/CKY2CM1PZ/p1583925694020400Les propriétés d'une TSDBhttps://bigdatahebdo.slack.com/archives/CKY2CM1PZ/p1583870681011800RedisTimeSeries 1.2https://redislabs.com/blog/redistimeseries-version-1-2-is-here/InfluxDB 2.0 b6https://www.influxdata.com/blog/release-announcement-influxdb-2-0-0-beta-6/Warp10 dépasse les 1000 fonctionshttp
24/03/2020 • 1 hour 11 minutes 29 seconds
Episode 96 : Le dernier cornichon s'est fait croquer
The Last Pickle Joining DataStaxhttp://thelastpickle.com/blog/2020/03/04/tlp-joining-datastax.htmlGoogle rise K8S pricehttps://cloud.google.com/kubernetes-engine/pricingLes Revenus d'elastic vs AWShttps://twitter.com/pauldix/status/1233093948425588737https://twitter.com/mjasay/status/1233082891585904642Elastic sur clever cloudhttps://www.clever-cloud.com/blog/features/2020/03/05/elastic-stack/?pk_campaign=elastic-stack-plati
07/03/2020 • 1 hour 12 minutes 54 seconds
Episode 95 : Le futur de la data avec Paul Peton
Un episode sur la base d'articles écrits par Paul Peton : "De quoi le futur de la data sera-t-il fait ? (sous un intervalle de prévision assez large…)”https://link.medium.com/JJ9afimvw4“Choisir un environnement technique pour la Data Science” https://link.medium.com/0Dv7uSsvw4L'instant confiture : les réseaux de neuronesLOVELY ANALYTICS - Réseaux de neurones comment ça marche ?https://lovelyanalytics.com/2017/06/14/reseaux-de-neurones-comment-ca-marche/Une vidéo de Youen de Saagie allant jusqu’au Deep Learning : https://www.youtube.com/watch?v=6XqhY29uzlMEt pour se détendre (ne pas se lais
02/03/2020 • 1 hour 35 minutes 30 seconds
Episode 94 : Data Lake House
THE DATA LAKEHOUSE ?https://www.moderndataanalytics.com/post/the-data-lakehouseWhat Is a Data Lakehouse?https://databricks.com/blog/2020/01/30/what-is-a-data-lakehouse.htmlDBLog: A Generic Change-Data-Capture Frameworkhttps://medium.com/netflix-techblog/dblog-a-generic-change-data-capture-framework-69351fb9099bMySQL is the DBMS of the Year 2019https://db-engines.com/en/blog_post/83Keystone Real-time Stream Processing Platform<a href="https://netflixtechblog.com/keystone-real-time-stream-processing-platform-a3ee651812a"
26/02/2020 • 1 hour 53 seconds
Episode 93 : Foundation DB
Foundation DBhttps://github.com/apple/foundationdb/wiki/FoundationDB-Release-7.0-Planninghttps://pierrezemb.fr/posts/notes-about-foundationdb-------------------------------------------------------------DevFest du Bout du Monde 2020The DevFest, or 'Developers Festival', is a technical conferences for software developers. It is aimed to students, profesionals or simply curious technophile.https://devfest.duboutdumonde.bzh/-------------------------------------------------------------OvhCloud / Datahttps://www.ovhcloud.com/fr/public-cloud/data-analytics/<br
17/02/2020 • 1 hour 45 minutes 15 seconds
Episode 92 : T'as lu le Codd ?
Better Drivers for Cassandrahttps://www.datastax.com/blog/2020/01/better-drivers-for-cassandraInfluxDB 2.0 beta 1https://www.influxdata.com/blog/influxdb-2-0-open-source-beta-released/InfluxDB 2.0 beta 2https://www.influxdata.com/blog/release-announcement-influxdb-2-0-0-beta-2/When to Say No to Machine Learninghttps://medium.com/semi-random-thoughts/a-product-managers-guide-to-when-to-say-no-to-machine-learning-and-when-to-say-yes-1cd6d7884c7Usin
02/02/2020 • 1 hour 24 minutes 16 seconds
Episode 91 : C'est en rachetant qu'on devient un géant
-----------------------------Quelques newsGoogle May Buy Salesforce To Help Bolster Its Cloud Businesshttps://www.webpronews.com/google-may-buy-salesforce/The Apache Software Foundation Bloghttps://blogs.apache.org/foundation/entry/the-apache-news-round-up151 - Apache Libcloud 2.7.0 released http://libcloud.apache.org/ - Apache Libcloud 2.8.0 released https://libcloud.apache.org/ - Apache TVM (Incubating) 0.6.0 released https://tvm.apache.org/ - Apache Druid (incubating) 0.16.1 released http://druid.apache.org/ - Apache HBas
14/01/2020 • 1 hour 27 minutes 37 seconds
Episode 90 : La FAQ de NOEL 2019
LA FAQ de NOEL (Décembre 2019)Dans cet épisode on répond aux questions de nos auditeurs présents dans le Slack.Pour rejoindre le Slack c'est ici : http://trkit.io/s/invitebdh-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et <a href="https://twitter.com/nstein
23/12/2019 • 1 hour 20 minutes 54 seconds
Episode 89 : Si AWS ne fait pas un service managé avec ton produit tu n'existes pas
Episode 89 : Si AWS ne fait pas un service managé avec ton produit, tu n'existes pasLa FAQ de Noël pour l'épisode 90 : https://trkit.io/s/BDHFAQNOEL----------------------------------------------------------------Cocorico ou presqueDataiku : Florent Douetteau [Podcast / Itw]https://pca.st/vdt5xiutAvec Dataiku, la France se dote d’une nouvelle « licorne »https://www.lemonde.fr/economie/article/2019/12/04/avec-dataiku-la-france-se-dote-d-une-nouvelle-licorne_6021687_3234.html----------------------------------------------------------------TimeseriesTime Series Prediction - A short introduction for pragmatists<a href="https:/
10/12/2019 • 1 hour 6 minutes 45 seconds
Episode 88 : DB ou pas DB ?
Episode 88 La FAQ de Noël pour l'épisode 89 : https://trkit.io/s/BDHFAQNOELCloud & OpsThe $10m engineering problemhttps://segment.com/blog/the-10m-engineering-problem/Dockerhttps://techcrunch.com/2019/11/13/mirantis-acquires-docker-enterprise/https://www.docker.com/press-release/docker-new-directionhttps://www.docker.com/blog/docker-next-chapter-advancing-developer-workflows-for-modern-apps/<a href="https://thenewstack.io/mirantis-acquires-docker-enterp
28/11/2019 • 1 hour 23 minutes 27 seconds
Episode 87 : Un elephant peut en cacher un autre
Episode 87 pgday Paris 2020https://2020.pgday.paris/----------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttp://bit.ly/Invitebdh----------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoAdrien : https://twitter.com/Adrien_nayratNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jér
13/11/2019 • 1 hour 19 minutes 52 seconds
Episode 86 : des news et des meetups qui pulsent
Episode 86 : Des news et des meetups qui pulsent----------------------------------------------------------------De retour du front Pulsar au hadoop user grouphttps://www.meetup.com/fr-FR/Hadoop-User-Group-France/events/264920447/Dataops rocks summit 2019https://www.dataops.rocks/fr/----------------------------------------------------------------ops et CloudLe guide de Chaos Engineering : Partie 1https://blog.wescale.fr/2019/09/26/le-guide-de-chaos-engineering-part-1/What’s Going on with GKE and Anthos?https://bravenewgeek.com/whats-going-
19/10/2019 • 1 hour 14 minutes 40 seconds
Episode 85 : En direct du OVH Cloud Summit
Episode 85-------------------------------------------------------------OVH Cloud Summit -------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Vincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Aff
12/10/2019 • 26 minutes 5 seconds
Episode 84 : Kubernetes et Traefik sont de Maesh
Episode 84---------------------------------------------- Timeseries ---Paris Time Series Meetuphttps://www.meetup.com/fr-FR/Paris-Time-Series-Meetup/events/264517156/https://twitter.com/ParisTimeSerieshttps://youtu.be/6kFv_W6Y-Q0https://cloud.cerenit.fr/index.php/s/2BsPHPKiMa2pZj7-------------------------- Databases ---Paris | MongoDB.localhttps://mongodb.com/local/parisDemystifying LevelDBhttps://blog.senx.io/demystifying-leveldb/
05/10/2019 • 1 hour 6 minutes 50 seconds
Episode 83 : Le Z il n'y a rien au dessus
Episode 83--------------------Cobol, 60 ans, toujours aux commandeshttps://www.lemondeinformatique.fr/actualites/lire-cobol-60-ans-toujours-aux-commandes-76385.htmlAvec le z15, IBM renforce la protection sur les donnéeshttps://www.lemondeinformatique.fr/actualites/lire-avec-le-z15-ibm-renforce-la-protection-sur-les-donnees-76420.htmlFiche technique du z15https://www.ibm.com/downloads/cas/NN7GBPJ1IBM Introduces Next-Gen Z Mainframe: The z15; Wider Cores, More Cores, More Cache, Still 5.2 GHz<a href="https://fuse.wikichip.org/news/2659/ibm-introduces-next-gen-z-mainframe-the-z15
24/09/2019 • 1 hour 7 minutes 15 seconds
Episode 82 : Quand tu es idéaliste tu fais des listes
Episode 82 --------------------Time SeriesParis Time Series Meetup #1https://www.meetup.com/fr-FR/Paris-Time-Series-Meetup/events/264517156Telegraf 1.12https://www.influxdata.com/blog/release-announcement-telegraf-1-12-0/--------------------SparkHow I test with Apache Spark?https://medium.com/@nastasia.saby/how-i-test-with-apache-spark-97b2bacf0b77--------------------DatabasesAnnouncing the first Postgres extension to run WebAssemblyhttps://medium.com/wasmer/announcing-the-first-postgres-extension-t
11/09/2019 • 59 minutes 55 seconds
Episode 81 : La vie est faite de choix surtout quand on traite de la data
Episode 81 Updated Microsoft licensing terms for dedicated hosted cloud serviceshttps://www.microsoft.com/en-us/licensing/news/updated-licensing-rights-for-dedicated-cloudMicrosoft hikes cost of licensing its software on rival public clouds, introduces Azure 'Dedicated' Hostshttps://www.theregister.co.uk/2019/08/05/microsoft_licensing_windows_clouds/Microsoft Screws Customers and its Own Advocates Alikehttps://www.lastweekinaws.com/blog/microsoft-screws-customers-and-its-own-advocates-alike/It's official: Deploying Facebook's 'Like' button on your website makes you a joint data sl
27/08/2019 • 1 hour 2 minutes 4 seconds
Episode 80 : Ne met pas ta bigdata dans un SAN
HadoopHewlett Packard Enterprise fait l’acquisition de MapRhttps://www.zdnet.fr/actualites/hewlett-packard-enterprise-fait-l-acquisition-de-mapr-39888799.htmZookeeper 3.5https://zookeeper.apache.org/doc/r3.5.5/releasenotes.htmlhttps://zookeeper.apache.org/releases.html"DatabasePresto Unlimitedhttp://prestodb.github.io/blog/2019/08/05/presto-unlimited-mpp-database-at-scaleWarp10 2.1https://blog.senx.io/warp-10-version-2-1/<br /
16/08/2019 • 1 hour 36 minutes 35 seconds
Episode 79 : du neuf et du moins neuf
Time seriesRedisTimeSeries Module Adds Time Series Database Features to Redishttps://www.infoq.com/news/2019/07/redis-time-series-moduleRedisTimeSeries GA – Making the 4th dimension truly immersivehttps://redislabs.com/blog/redistimeseries-ga-making-4th-dimension-truly-immersive/How Hulu Uses InfluxDB and Kafka to Scale to Over 1 Million Metrics a Secondhttps://medium.com/hulu-tech-blog/how-hulu-uses-influxdb-and-kafka-to-scale-to-over-1-million-metrics-a-second-1721476aaff5CassandraStreaming Cassandra at WePay - Part 1<a href="https://wecode.wepay.
29/07/2019 • 1 hour 28 minutes 54 seconds
Episode 78 : Les jeunes prennent les commandes
Time SeriesInfluxDays London 2019https://www.cerenit.fr/blog/influxdays-london-2019/How to Mix Metrics and Logs with Grafana and Influxhttps://grafana.com/blog/2019/06/27/how-to-mix-metrics-and-logs-with-grafana-and-influx/Meetup Time Series Parishttps://www.meetup.com/fr-FR/Paris-Time-Series-Meetup/Warp 10™ Raspberry Pi 4 bench for industrial IoThttps://blog.senx.io/warp-10-raspberry-bench-for-industrial-iot/DatabaseRetour d’utilisation de Mongodb et pourquoi nous migrons vers Postgresql<a href="http://www.ev
15/07/2019 • 1 hour 12 minutes 9 seconds
Episode 77 : Elassandra, mémoires géantes, et bases de données
Nous recevons pour cet épisode Vincent Royer qui vient nous parler d'Elassandra dont il est le créateur et de plein d'autres choseshttp://www.elassandra.io/https://twitter.com/elassandraioPour en savoir plus c'est dans l'Episode 46Se préparer à la NVRAM : Intel 3D Xpoint débarque bientôthttps://www.zdnet.fr/actualites/se-preparer-a-la-nvram-intel-3d-xpoint-debarque-bientot-39882653.htmTiDB 2.1.7https://jepsen.io/analyses/tidb-2.1.7mattm/sql-style-guidehttps://github.com/mattm/sql-style-guide2019 Open Source Database Repo
02/07/2019 • 1 hour 40 minutes 49 seconds
Episode 76 : L'As des Aces
Looker to Join Google Cloudhttps://looker.com/blog/looker-to-join-google-cloudRachat de Tableau par Salesforcehttps://techcrunch.com/2019/06/10/salesforce-is-buying-data-visualization-company-tableau-for-15-7b-in-all-stock-deal/https://realmoney.thestreet.com/investing/technology/salesforce-deal-for-tableau-takeaways-14986369Cassandra Meetup (canal historique)https://www.meetup.com/fr-FR/Cassandra-Paris-Meetup/events/261869169/Storm 2.0.0 Released<a href="https://st
22/06/2019 • 1 hour 29 minutes 22 seconds
Episode 75 : the clever, the safe and the ugly
Clever Cloud identity, reloadedhttps://www.clever-cloud.com/blog/company/2019/05/27/clever-cloud-new-logo/Big-data bombshell: MapR may shut down as investor pulls out after ‘extremely poor results’https://siliconangle.com/2019/05/30/mapr-may-shut-investor-pulls-following-extremely-poor-results/Update de MAPR https://mapr.com/blog/an-update-from-mapr/Dependabot is Now Free and It’s Amazinghttps://nimbleindustries.io/2019/05/26/dependabot-is-now-free-and-its-amazing/NoSQLSecurity for Elasticsearch is now f
05/06/2019 • 1 hour 36 minutes 44 seconds
Episode 74 : Le soldat wsl2 sauvera t’il la cogip ?
Snips Open Sources Tracthttps://medium.com/snips-ai/snips-open-sources-tract-cdc50f437ef2AI Weekly: Google’s ethics council barely lasted a week, but there’s a thin silver lininghttps://venturebeat.com/2019/04/05/ai-weekly-googles-ethics-council-barely-lasted-a-week-but-theres-a-thin-silver-lining/Google ouvre un centre mondial dédié à la vie privée en Europehttp://www.lefigaro.fr/secteur/high-tech/google-ouvre-un-centre-mondial-dedie-a-la-vie-privee-en-europe-20190514Thoughtworks Technology Radar vol 20 - Avril 2019<a href="https://www.thoughtwo
18/05/2019 • 1 hour 4 minutes 29 seconds
Episode 73 : Si t'as pas le mode sombre t'as raté ta vie
Venez nombreux au Google Cloud SummitOn vous attends sur le stand Affini-TechPour s'inscrire c'est là : http://bit.ly/GoogleCloudParis2019Elastic Stack 7.0.0 releasedhttps://www.elastic.co/blog/elastic-stack-7-0-0-releasedKafka : Migrer un consommateur vers Streams et Connecthttp://blog.ippon.fr/2019/04/29/rex-migrer-un-consommateur-vers-streams-et-connect/The PipelineDB Team Joins Confluenthttps://www.confluent.io/blog/pipelinedb-team-joins-confluenthttps://www.pipelinedb.com/blo
04/05/2019 • 1 hour 24 minutes 49 seconds
Episode 72 : WARP 10 avec Mathias Herberts
Warp 10 : https://www.warp10.io/Warp Fleethttps://warpfleet.senx.io/le twitter de Warp 10 https://twitter.com/warp10ioEt pour aller encore plus loin : https://twitter.com/WarpScriptLa société SenXhttps://senx.io/Le Twitter de SenXhttps://twitter.com/senxhqPour retrouver Mathias Herberts https://twitter.com/herbertshttps://www.linkedin.com/in/herberts/-------------------------------------------------------------<
22/04/2019 • 49 minutes 46 seconds
Episode 71 : Google Cloud Next 19
Le slack est ouvert !http://bit.ly/invitebdhLancement d'Anthoshttps://cloud.google.com/blog/topics/hybrid-cloud/new-platform-for-managing-applications-in-todays-multi-cloud-worldCloud Runhttps://cloud.google.com/blog/products/serverless/announcing-cloud-run-the-newest-member-of-our-serverless-compute-stackCompute-optimized VM + Memory-optimized VMhttps://cloud.google.com/blog/products/compute/introducing-compute-and-memory-optimized-vms-for-goo
13/04/2019 • 1 hour 9 minutes 39 seconds
Episode 70 : Les bonnes questions
Bigdata ParisRetour rapide sur Big Data ParisLes bonnes questionsMaybe You Don't Need Kuberneteshttps://matthias-endler.de/2019/maybe-you-dont-need-kubernetes/Secret Design Docs: Multi-Tenant Orchestratorhttps://blog.jessfraz.com/post/secret-design-docs-multi-tenant-orchestrator/Was MongoDB Ever the Right Choice?https://www.simplethread.com/was-mongodb-ever-the-right-choice/DatabaseSnowflake: The Good, The Bad and The Uglyhttps://0x0fff.com/snowflake-the-good-the-bad-and-the-ugly/KA
08/04/2019 • 1 hour 13 minutes 57 seconds
Episode 69 : Le dilemme de Batman
OSS for ever !Keeping Open Source Open – Open Distro for Elasticsearchhttps://aws.amazon.com/blogs/opensource/keeping-open-source-open-open-distro-for-elasticsearch/Supporting The Apache Software Foundationhttps://aws.amazon.com/blogs/opensource/supporting-apache-software-foundation/On "Open" Distros, Open Source, and Building a Companyhttps://www.elastic.co/blog/on-open-distros-open-source-and-building-a-companyAWS intends for their new project to be an Elasticsearch fork<a href="https://www.influxdata.com/blog/aws-intends-for-their-new-project-to-be-an-elasticsearch-fork/" rel="
17/03/2019 • 1 hour 6 minutes 56 seconds
Episode 68 : KaaS la baraque
Cloud et open sourceLa bataille entre vrai open source et faux open source s'intensifiehttps://www.zdnet.fr/actualites/la-bataille-entre-vrai-open-source-et-faux-open-source-s-intensifie-39881007.htmLes fournisseurs cloud, bourreaux de l'open source ?https://www.zdnet.fr/actualites/les-fournisseurs-cloud-bourreaux-de-l-open-source-39881337.htmLCC 205 - Interview analyse de l'industrie avec Sacha Laboureyhttps://lescastcodeurs.com/2019/02/21/lcc-205-interview-analyse-de-l-industrie-avec-sacha-labourey/KubernetesManaged Kubernete
04/03/2019 • 1 hour 17 minutes 58 seconds
Episode 67 : Uber GPU Database
DatabaseUnderstanding Database Shardinghttps://www.digitalocean.com/community/tutorials/understanding-database-shardingIntroducing AresDB: Uber’s GPU-Powered Open Source, Real-time Analytics Enginehttps://eng.uber.com/aresdb/NoSQL for the serverless age: Announcing Cloud Firestore general availability and updateshttps://cloud.google.com/blog/products/databases/announcing-cloud-firestore-general-availability-and-updates/Deux ans après l’infection, des bases de données MongoDB attendent encore que la rançon soit payée<a href="https://www.zdnet.fr/amp/actualites/deux-ans-apres-l-infection-des-bases-de-donnees-mongodb-attendent-e
18/02/2019 • 1 hour 12 minutes 3 seconds
Episode 66 : Papa est de retour
KafkaConfluent Raises a $125M Series D Funding Roundhttps://www.confluent.io/blog/confluent-raises-a-125m-series-d-funding-roundDatabasesInfluxDB 2.0 Alpha Release and the Road Aheadhttps://www.influxdata.com/blog/influxdb-2-0-alpha-release-and-the-road-ahead/Introducing the Next-Generation InfluxDB 2.0 Platformhttps://www.influxdata.com/blog/introducing-the-next-generation-influxdb-2-0-platform/Microsoft Acquires Citus Data: Creating the World’s Best Postgres Experience Togetherhttps://www.citusdata.
04/02/2019 • 1 hour 19 minutes 53 seconds
Episode 65 : La famille s'agrandit
DatabaseThe Guardian’s Migration from MongoDB to PostgreSQL on Amazon RDShttps://www.infoq.com/news/2019/01/guardian-mongodb-postgresqlSQL is Dead, Hail to Fluxhttp://bit.ly/2CrzERXInfrastructureBlog: APIServer dry-run and kubectl diffhttps://kubernetes.io/blog/2019/01/14/apiserver-dry-run-and-kubectl-diff/Infrastructure as real codehttps://gianarb.it/blog/infrastructure-as-real-codeDatascienceAn Introduction to the Machine Learning Platform as a Servicehttp://bit.ly/2AHpv2tWhy Dask ?<
21/01/2019 • 1 hour 10 minutes 12 seconds
Episode 64 : Happy New Year 2019
Episode 64 : “Happy new year 2019” -----------------------------AI predictions for 2019 from Yann LeCun, Hilary Mason, Andrew Ng, and Rumman Chowdhury | VentureBeathttps://venturebeat.com/2019/01/02/ai-predictions-for-2019-from-yann-lecun-hilary-mason-andrew-ng-and-rumman-chowdhury/Interview de Yann Le Cun https://anchor.fm/ouiareny/episodes/3-Yann-LeCun-Facebook--Comment-lexcellence-scientifique-Franaise-brille-chez-Facebook-e2pt9p/a-a7tui6-----------------------------In the CloudBigtable Autoscaler: saving money and time using managed storage<a href="https://labs.spotify.com/2018/12/18/bigtable-autoscaler-saving-mo
06/01/2019 • 1 hour 11 minutes 34 seconds
Episode 63 : “Re-Invent le Cloud”
Episode 63 : “Re-Invent le Cloud” -----------------------------In the CloudAmazon Timestreamhttps://aws.amazon.com/fr/timestream/Amazon Forecast – Time Series Forecasting Made Easyhttps://aws.amazon.com/fr/blogs/aws/amazon-forecast-time-series-forecasting-made-easy/Amazon DynamoDB On-Demand – No Capacity Planning and Pay-Per-Request Pricinghttps://aws.amazon.com/fr/blogs/aws/amazon-dynamodb-on-demand-no-capacity-planning-and-pay-per-request-pricing/Amazon Quantum Ledger Database (QLDB)https://aws.amazon.com/fr/qldb/<br
15/12/2018 • 1 hour 12 minutes
Episode 62 : This is what happens Larry
In the CloudCloud Data Warehouse Benchmark: Redshift, Snowflake, Azure, Presto, BigQueryhttps://fivetran.com/blog/warehouse-benchmarkExtending the SQL capabilities of your Cloud Dataproc cluster with the Presto optional componenthttps://cloud.google.com/blog/products/data-analytics/extending-the-sql-capabilities-of-your-cloud-dataproc-cluster-with-the-presto-optional-componentGive meaning to 100 billion analytics events a dayhttps://medium.com/teads-engineering/give-meaning-to-100-billion-analytics-events-a-day-d6ba09aa8f44Introducing Amazon Corretto, a N
26/11/2018 • 1 hour 11 minutes 41 seconds
Episode 61 : Retour aux (open) sources
In the CloudIBM to Acquire Linux Distributor Red Hat for $33.4 Billionhttps://www.bloomberg.com/news/articles/2018-10-28/ibm-is-said-to-near-deal-to-acquire-software-maker-red-hatHDFS vs. Cloud Storage: Pros, cons and migration tipshttps://cloud.google.com/blog/products/storage-data-transfer/hdfs-vs-cloud-storage-pros-cons-and-migration-tipsNew Cloudera Plots a Course Toward a Unified Futurehttps://www.datanami.com/2018/10/24/new-cloudera-plots-a-course-toward-a-unified-future/Building a Serverless End-to-End Solution for Brand De
10/11/2018 • 1 hour 10 minutes 19 seconds
Episode 60 : J'peux pas j'ai Nouvelle Zelande
-----------------------------HadoopCloudera and Hortonworks merger means Hadoop’s influence is declininghttps://venturebeat.com/2018/10/06/cloudera-and-hortonworks-merger-means-hadoops-influence-is-declining/-----------------------------DatabaseSnowflakehttps://www.frenchweb.fr/cloud-450-millions-de-dollars-pour-la-licorne-franco-americaine-snowflake/338077NewSQL database systems are failing to guarantee consistency, and I blame Spannerhttp://dbmsmusings.blogspot.com/2018/09/newsql-database-systems-are-failing-to.htmlGoogle Clou
25/10/2018 • 1 hour 13 minutes 9 seconds
Episode 59 : We are back !
DatabaseA new Compaction strategy for Cassandrahttps://blog.pythian.com/proposal-for-a-new-cassandra-cluster-key-compaction-strategy/Apache Cassandra Performance Tuning - Compression with Mixed Workloadshttp://thelastpickle.com/blog/2018/08/08/compression_performance.htmlReaper donated to the Apache Cassandra projecthttps://lists.apache.org/thread.html/12a870479d78bb4e45a616fdb9ea17743ec864ca1ed1f0c75f9f5071@%3Cdev.cassandra.apache.org%3EOrigins of Apache Cassandra with Jonathan Ellis and Avinash Lakshman<a href="https://www.youtube.com/watch?v=0hNJmb77GWg&feature=youtu.be" rel="noop
31/08/2018 • 1 hour 20 minutes 6 seconds
Episode 58 : Data-Astro-Science
DatabaseFoundationDB, a very interesting NoSQL database owned by Apple, is now an open-source projecthttps://www.geekwire.com/2018/foundationdb-interesting-nosql-database-owned-apple-now-open-source-project/https://www.foundationdb.org/blog/foundationdb-is-open-source/Anna: A KVS for any scalehttps://blog.acolyer.org/2018/03/27/anna-a-kvs-for-any-scale/DataStax Enterprise 6.0https://docs.datastax.com/en/dse/6.0/dse-admin/datastax_enterprise/newFeatures.htmlMonitorer l’inconnu, 1000 * 100 series pa
24/06/2018 • 53 minutes 34 seconds
Episode 57 : C'est comme prévoir que t'auras pas de succès !
Troll of the week : Patrick McFadinhttps://twitter.com/PatrickMcFadin/status/984467651752841219?s=20"Most everyone doing something at scale is probably using #cassandra" Oh. Except for @EpicGames and @FortniteGame They went with MongoDB.Here's the postmortem: https://www.epicgames.com/fortnite/en-US/news/postmortem-of-service-outage-at-3-4m-ccuAerospike 3.99.0.3https://jepsen.io/analyses/aerospike-3-99-0-3Effectively-once semantics in Apache Pulsarhttps://streaml.io/blog/pulsar-effectively-once/Introducing Pulsar Functions<a href="https://streaml.io/bl
Building Reliable Reprocessing and Dead Letter Queues with Kafkahttps://eng.uber.com/reliable-reprocessing/Data Lineage sur Apache Spark avec Splinehttp://blog.ippon.fr/2018/02/19/data-lineage-spark-avec-spline/Elastic - Doubling Down on Openhttps://www.elastic.co/blog/doubling-down-on-openhttps://www.elastic.co/products/x-pack/openJupyterLab is Ready for Usershttps://blog.jupyter.org/jupyterlab-is-ready-for-users-5a6f039b8906Cherami: Uber Engineering’s Durable and Scalable Task Queue in Go<a hre
05/03/2018 • 1 hour 26 minutes 29 seconds
Episode 54 : CockroachDB avec Julien Anguenot
Julien Anguenot d'Iland Cloud - https://www.iland.com/ - nous parle de CockroachDB - https://www.cockroachlabs.com/ - le clone open source de Cloud Spanner - https://cloud.google.com/spanner/) qu'il a mis en production en complément d'Apache Cassandra, pour des besoins internes.Julien et Alexander participeront en tant que speakers au prochain Paris Cassandra Meetup le 31 Janvier 2018 chez Deezer : https://www.meetup.com/fr-FR/Cassandra-Paris-Meetup/events/246902065/On a ouvert un Slack : bigdatahebdo.slack.cominvitation par DM @bigdatahebdo ou sur [email protected] le blog D'affini-Tech<a href="http://blog.affi
22/01/2018 • 1 hour 13 minutes 35 seconds
Episode 53 : 2017 review
Metrics : 10500 écoutes en 2017 (moyenne à 617 écoutes)17 episodes en 2017 (vs 14 en 2016, et 10 en 2015)Top 2017 : Episode 38 : SQL is back (Spanner / CockroachDB)Episode 42 : GDPR dans la pratiqueEpisode 37 : La bourse ou MongoDBEpisode 43 : DevoxxFr, Kafka, AWS, Microsoft CosmosDB, AMLEpisode 36 : AI ApocalypseTop overall : Episode 35 : Microsoft U-SQL avec Michel CaradecEpisode 28 : Quelques news de rentréeEpisode 38 : SQL is backEpisode 42 : GDPR dans la pratiqueEpisode 37 : La bourse ou MongoDBLes mots les plus cités dans les show notes : Apache25Kafka25Google17Cloud13Spark9Azure6Summit5Hadoop5Spanner4Cassandra4MongoDB4Beam4Confluent4Sélection de l’année 2017 (Vincent) : KafkaBeam Spanner / CockroachDBGoogle Cloud Redis (Episode 41 avec Damien Krotki
13/01/2018 • 1 hour 2 minutes
Episode 52 : Cosmos speaks Cassandra
Reaper 1.0 Has Been Released!http://thelastpickle.com/blog/2017/11/14/reaper-10-announcement.htmlDear Cassandra Developers, welcome to Azure #CosmosDB!https://azure.microsoft.com/en-us/blog/dear-cassandra-developers-welcome-to-azure-cosmosdb/https://venturebeat.com/2017/11/15/microsoft-updates-cosmos-db-with-cassandra-support-better-availability-guarantees/Introducing Azure Databrickshttps://databricks.com/blog/2017/11/15/intr
15/12/2017 • 1 hour 12 minutes 15 seconds
Episode 51 : Apache Beam avec Jean-Baptiste Onofré
http://beam.incubator.apache.org/Vous pouvez retouver Jean-Baptiste :http://blog.nanthrax.net/https://github.com/jbonofrehttps://twitter.com/jbonofre https://www.linkedin.com/in/jean-baptiste-onofr%C3%A9-a0739317Lisez le blog D'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : <a href="https://twitter.com/v
18/11/2017 • 1 hour 9 minutes 55 seconds
Episode 50 : Kafka 1.0 Java 9 et bien d'autres
KafkaApache Kafka Goes 1.0https://www.confluent.io/blog/apache-kafka-goes-1-0/Getting Started Analyzing Twitter Data in Apache Kafka through KSQLhttps://www.confluent.io/blog/using-ksql-to-analyse-query-and-transform-data-in-kafkaStories from the Front: Lessons Learned from Supporting Apache Kafkahttps://www.confluent.io/blog/stories-front-lessons-learned-supporting-apache-kafka/Apache ZooKeeper and Apache Kafka on Kubernetes StatefulSets & DaemonSetshttp://blog.kubernetes.io/2017/09/kubernetes-statefulsets-daemo
09/11/2017 • 1 hour 4 minutes 50 seconds
Episode 49 : En direct du Google Cloud Summit Paris
En direct du Google Cloud Summit de Paris le 19 octobre 2017 avec William Vambenepe ( https://twitter.com/vambenepe )GOOGLE CLOUD BIG DATA AND MACHINE LEARNING BLOGhttps://cloud.google.com/blog/big-data/La playlist Youtube ou vous devrez rapidement retrouver les présentations du Summithttps://www.youtube.com/user/googlecloudplatform/playlists-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Cette publication est sponsorisée
23/10/2017 • 25 minutes 18 seconds
Episode 48 : no views ?
Cassandra : Proposal to retroactively mark materialized views experimentalhttps://lists.apache.org/thread.html/d81a61da48e1b872d7599df4edfa8e244d34cbd591a18539f724796f@%3Cdev.cassandra.apache.org%3ECassandra pluggable storage enginehttps://lists.apache.org/thread.html/0540e793ec58eb97d8afe294635279d16e0191f9b613ad3edd710181@%3Cdev.cassandra.apache.org%3Ecouchbasehttps://www.couchbase.com/products/data-platformGoogle Cloud Dataprep - Data Handling Made Easierhttps://medium.com/google-cloud/goog
10/10/2017 • 38 minutes 25 seconds
Episode 47 : Kafka, SQL, Beam and co
Exactly-once Semantics are Possible: Here’s How Kafka Does ithttps://www.confluent.io/blog/exactly-once-semantics-are-possible-heres-how-apache-kafka-does-it/?utm_content=buffer9b1b6&utm_medium=social&utm_source=twitter.com&utm_campaign=bufferhttps://blog.ippon.fr/2017/07/11/kafka-0-11-0-%E2%99%A5/Confluent KSQLhttps://www.confluent.io/blog/ksql-open-source-streaming-sql-for-apache-kafka/https://www.youtube.com/watch?v=A45uRzJiv7I&feature=youtu.be<br /
08/09/2017 • 1 hour 17 minutes 59 seconds
Episode 46 : Elassandra
Nous recevons pour cet épisode Vincent Royer qui vient nous parler d'Elassandra dont il est le créateur. http://www.elassandra.io/https://twitter.com/elassandraioLe github du projethttps://github.com/strapdata/elassandraLa société Strapdata http://www.strapdata.comLe talk du C* Summit 2016 : "Elassandra: Elasticsearch as C* Secondary Index"https://www.youtube.com/watch?v=0WuLZTvA3YMet les slides associés : https://fr.slide
04/09/2017 • 1 hour 12 minutes 56 seconds
Episode 45 : Trifacta Wrangler avec Victor Coustenoble
Victor Coustenoble nous explique aujourd'hui ce qu'est le "Data Wrangling". Trifacta est un outil de préparation de données intégré dans nos plateformes data favorites. Pour en savoir plus sur Trifacta c'est ici : https://www.trifacta.com/fr/ et là : https://www.trifacta.com/news-and-press/?language=frVous pouvez retrouver Victor sur sont twitter : https://twitter.com/vizanalytics ou sur Linkedin : https://www.linkedin.com/in/victorcoustenoble/------------------------------------------------------------- http://www.bigdatahebdo.comhttps://twitter
12/07/2017 • 55 minutes 33 seconds
Episode 44 : Apachecon, et des news en vrac...
Apache BigData Retour sur Apache BigDataDataStax announces availability of ‘white glove’ managed cloud servicehttp://diginomica.com/2017/05/23/datastax-announces-availability-white-glove-managed-cloud-service/amp/CockroachDB 1.0 is Production-Readyhttps://www.cockroachlabs.com/blog/cockroachdb-1-0-release/Local and distributed query processing in CockroachDBhttps://www.cockroachlabs.com/blog/local-and-distributed-processing-in-cockroachdb/#Azure Cosmos DB<a href="https://speakerdeck.com/dharmashukla/azure-cosmos-db-lessons-learnt-from-building-a-globally-distributed-databas
09/07/2017 • 53 minutes 42 seconds
Episode 43 : DevoxxFr, Kafka, AWS, Microsoft CosmosDB, AML
KafkaConfluent Cloud : Managed Apache Kafka par Confluenthttps://www.confluent.io/confluent-cloud/https://www.forbes.com/sites/alexkonrad/2017/05/08/confluent-brings-kafka-to-cloud-and-challenges-aws/amp/Kafka with Docker: A Docker introductionhttps://ngeor.wordpress.com/2017/03/25/kafka-with-docker-a-docker-introduction/amp/Apache Flink and Apache Kafka Streams: a comparison and guideline for usershttps://www.confluent.io/blog/apache-flink-apache-kafka-streams-comparison-guideline-users/
15/05/2017 • 1 hour 17 minutes 10 seconds
Episode 42 : GDPR dans la pratique
Episode dédié au règlement européen sur les données privées ( GDPR ) avec la contribution de Jean-Louis Quéguiner que vous pouvez suivre sur Linkedin ( https://www.linkedin.com/in/jlqueguiner ).Jean-Louis est le CTO de Auchan Retail Data, et est donc confronté au quotidien au sujet GDPR. La feuille de route en 6 étapes de la CNIL : https://www.cnil.fr/fr/principes-cles/reglement-europeen-se-preparer-en-6-etapes-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Edité par Af
07/05/2017 • 57 minutes 31 seconds
Episode 41 : Redis avec Damien Krotkine
Episode dédié à la base Redis ( https://redis.io/ ) avec la contribution de Damien Krotkine que vous pouvez suivre sur Twitter ( https://twitter.com/damsieboy ) ou sur son blog ( http://damien.krotkine.com/ )Damien travaille chez Booking.com ( https://www.booking.com ). Ils seront présent le 24 Avril à dotscale.io ( https://www.dotscale.io/partner/booking.com ) et lors d'un Meetup à la suite de l'événement. -------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : <a href="
07/04/2017 • 1 hour 10 minutes 3 seconds
Episode 40 : Boontadata avec Benjamin Guinebertière
Le projet Boontadata vise à étudier les architectures de traitement de stream en fournissant des outils pour tester les différentes options disponibles sur le marché. Le blog de Boontadata est ici : https://boontadata.github.io/et les git sont ici : https://github.com/boontadataCe projet a été créé et est maintenu par Benjamin Guinebertière que vous pouvez retrouver sur twitter http://twitter.com/benjguin, ou sinon sur http://3-4.fr -------------------------------------------------------------Cet épisode a été enregistré avec le support de Microsoft France-------------------------------------------------------------http://www.bigdatahebdo.com<a href="
05/04/2017 • 48 minutes 10 seconds
Episode 39 : Quelques News, Kafka, Hoodie, Google Next, ScillaDB, IA, GDPR
Confluent raises $50M to continue growing commercial arm of Apache Kafkahttps://techcrunch.com/2017/03/07/confluent-raises-50m-to-continue-growing-commercial-arm-of-apache-kafka/How Kafka Redefined Data Processing for the Streaming Agehttps://www.datanami.com/2017/03/07/kafka-redefined-data-processing-streaming-age/Hoodie: Uber Engineering’s Incremental Processing Framework on Hadoophttps://eng.uber.com/hoodie/Analysis: It’s Amazon Web Services’ world – Google Cloud is just living in ithttp://siliconang
25/03/2017 • 1 hour 18 minutes 23 seconds
Episode 38 : SQL is back
SpannerSpanner, the Google Database That Mastered Time, Is Now Open to Everyonehttps://www.wired.com/2017/02/spanner-google-database-harnessed-time-now-open-everyone/Google Spanner Inspires CockroachDB To Outrun Ithttps://www.nextplatform.com/2017/02/22/google-spanner-inspires-cockroachdb-outrun/Spanner, TrueTime and the CAP Theoremhttps://research.google.com/pubs/pub45855.htmlSpanner quickstarthttps://cloud.google.com/spanner/docs/quickstart-console-------------------------------------------------------------DBT
03/03/2017 • 1 hour 17 minutes 25 seconds
Episode 37 : La bourse ou MongoDB
8 data trends on our radar for 2017https://www.oreilly.com/ideas/8-data-trends-on-our-radar-for-2017The Rise of the Data Engineerhttps://medium.com/@maximebeauchemin/the-rise-of-the-data-engineer-91be18f1e603#.8me3508a4Palantir et la France : naissance d’une nouvelle théorie abracadabrantesque ?https://reflets.info/palantir-et-la-france-naissance-dune-nouvelle-theorie-abracadabrantesque/http://www.silicon.fr/big-data-la-dgsi-se-rapproche-de-palantir-161283.html<a href="http://www.parismatch.com/Actu/International/La-CIA-appelee-au-secours-par-l-antiterrorisme-francai
28/01/2017 • 1 hour 9 minutes 14 seconds
Episode 36 : AI Apocalypse
Pour ce premier épisode de 2017, un gros focus sur l'IA et ses enjeux :The Great A.I. Awakeninghttp://mobile.nytimes.com/2016/12/14/magazine/the-great-ai-awakening.htmlUne I.A. remplace 34 employés d’une assurance au Japonhttp://www.numerama.com/tech/221747-une-i-a-remplace-34-employes-dune-assurance-au-japon.htmlLemonade Sets New World Record https://medium.com/@dschreiber/lemonade-sets-new-world-record-706ef8674110#.ze3xl0y97Washington s’inquiète des conséquences de l’IA sur le monde du travailhttp://www.numerama.com/politique/21
16/01/2017 • 1 hour 17 minutes 24 seconds
Episode 35 : Microsoft U-SQL avec Michel Caradec
Nous avons le plaisir de recevoir dans cet épisode Michel Caradec : Project Manager, Software & Data Engineer at CegidResponsable technique chez Cegid, éditeur de logiciels de gestion.En charge du développement des solutions décisionnelles et fiscales.Expert des technologies associées au traitement des données (moteurs de transformation, OLAP, architectures distribuées).Travaille sur les problématiques liées au Big Data et Machine Learning.Portfolio :Github : https://github.com/michelcaradec/RPubs : http://rpubs.com/mcaradecShiny : https://mcaradec.shinyapps.io/runrshiny/SlideShare : http://www.slideshare.net/mcaradec/Contributeur sur Data-Bzh (<a href="http://
08/12/2016 • 1 hour 6 minutes 47 seconds
Episode 34 : Serverless Monster
Amazon goes all in on AI and Big Data at AWS:Reinvent 2016http://www.techrepublic.com/article/amazon-goes-all-in-on-ai-and-big-data-at-aws-reinvent-2016/AWS EC2 Instances Updateshttps://aws.amazon.com/fr/blogs/aws/ec2-instance-type-update-t2-r4-f1-elastic-gpus-i3-c5Custom silicon, 9PB storage boxes, and 25Gb Ethernet – just another day in AWS hardwarehttp://www.theregister.co.uk/2016/11/30/aws_hardware/Amazon Athenahttps://aws.amazon.com/fr/athena/https://aws.amazon.com/fr/athena/prici
02/12/2016 • 57 minutes 14 seconds
Episode 33 : des news venues du Cloud...
Datastax acquires DataScale and announces Datastax Managed Cloudhttp://www.datastax.com/2016/11/announcing-datastax-managed-cloudMicrosoft's data announcements, and what they meanhttp://www.zdnet.com/article/microsofts-data-announcements-and-what-they-mean/Announcing GPUs for Google Cloud Platform https://cloudplatform.googleblog.com/2016/11/announcing-GPUs-for-Google-Cloud-Platform.htmlRetour sur le Spark Summit Europe 2016http://blog.ippon.fr/2016/11/08/retour-sur-le-spark-summit-europe-2016/<br
25/11/2016 • 1 hour 11 seconds
Episode 32 : Spark streaming avec Alexis Seigneurin
Alexis nous fait part de son expérience autour de Spark streaming et de la mise en production de pipelines de data-science. La présentation dont on parle est ici : https://www.youtube.com/watch?v=ps8JIqt1QJAles slides sont là : https://speakerdeck.com/aseigneurin/lessons-learned-using-spark-and-microservicesLa nouvelle plateforme "DataMC" de IPPON est là : http://datamc.io et là https://twitter.com/datamcioOn retrouve Alexis sur son tweeter ( https://twitter.com/aseigneurin ) et son blog ( http://aseigneurin.github.io )-----------------------------------<br
11/11/2016 • 57 minutes 13 seconds
Episode 31 : Quelques news, et la relation Datastax / Cassandra
Datastax vs Apache Software Foundationhttp://sdtimes.com/apache-foundation-board-reining-datastax/http://www.datastax.com/2016/11/serving-customers-serving-the-communityTeradata MPP on AWS et Teradata (re)embarks on a solutions journeyhttp://www.vldbsolutions.com/blog/teradata-mpp-aws/http://www.zdnet.com/article/teradata-reembarks-on-a-solutions-journey/#ftag=RSSbaffb68Pricing : https://aws.amazon.com/marketplace/pp/B01LW1R13TAnnouncing the dA Platform, our distribution of Apache® Fli
07/11/2016 • 1 hour 12 minutes 15 seconds
Episode 30 : Clever Cloud avec Quentin Adam
Clever Cloud et la data présenté par son CEO Quentin Adam. http://www.clever-cloud.com/Sinon pour retrouver Quentin c'est par ici : https://twitter.com/waxzcehttps://github.com/waxzcehttps://speakerdeck.com/waxzce
28/10/2016 • 47 minutes 15 seconds
Episode 29 : Apache Beam avec Jean-Baptiste Onofré
Un épisode qu'on a mis beaucoup de temps à sortir, et qui souffre d'une mauvaise qualité sonore, désolé. Le manque de bande passante est clairement l'ennemi du podcast. http://beam.incubator.apache.org/Vous pouvez retouver Jean-Baptiste :http://blog.nanthrax.net/https://github.com/jbonofrehttps://twitter.com/jbonofre https://www.linkedin.com/in/jean-baptiste-onofr%C3%A9-a0739317
24/10/2016 • 1 hour 3 minutes 2 seconds
Episode 28 : Quelques news de rentrée
Jonathan Ellis quitte le poste de chairman du projet Apache Cassandra http://www.datastax.com/2016/08/a-look-back-a-look-forwardApple rachète TupleJumphttp://www.macg.co/aapl/2016/09/apple-achete-intelligemment-tuplejump-95669Elastic scaling in Kafka streamshttp://www.confluent.io/blog/elastic-scaling-in-kafka-streamsApache Bahir externalise les extensions de streaming de Spark dans un nouveau projet top level Apachehttp://thenewstack.io/apache-bahir-gives-spark-extensions-new-home/Utiliser Cloudera Impala sur Amazon S3<a h
23/09/2016 • 41 minutes 38 seconds
Episode 27 : Cassandra: passé, présent et futur avec Jonathan Ellis et Alain Rodriguez
07/07/2016 • 1 hour 20 minutes 31 seconds
Episode 26 : Quelques news autour du Spark summit 2016
28/06/2016 • 51 minutes 12 seconds
Episode 25 : Led Notebook
13/06/2016 • 1 hour 7 minutes
Episode 24 : Zookeeper, la maladie du bigdata
23/05/2016 • 1 hour 7 minutes 34 seconds
Episode 23 : Kafka à DevoxxFR
16/05/2016 • 1 hour 27 minutes 28 seconds
Episode 22 : Reborn
02/05/2016 • 47 minutes 59 seconds
Episode 21 : 67 Mds
29/10/2015 • 13 minutes 8 seconds
Episode 20 : Retour d'experience sur Cassandra
03/09/2015 • 1 hour 26 minutes 40 seconds
Episode 19 : Scikit-Learn avec Olivier Grisel
17/06/2015 • 49 minutes 28 seconds
Episode 18 : Pour se renseigner il faut regarder
03/06/2015 • 51 minutes 3 seconds
Episode 17 : Drill, R , Spark, etc...
19/05/2015 • 21 minutes 11 seconds
Episode 16 : Build a Notebook
05/05/2015 • 16 minutes 43 seconds
Episode 15 : No one buys Hadoop
21/04/2015 • 17 minutes 50 seconds
Episode 14 : Hadoop au sommet
14/04/2015 • 18 minutes 30 seconds
Episode 13 : Ecoute bien Larry
07/04/2015 • 13 minutes 30 seconds
Episode 12 : News etc... les suspects habituels
31/03/2015 • 14 minutes 16 seconds
Episode 11 : Spark, Flink...
24/03/2015 • 16 minutes 44 seconds
Episode 10 : Machine Learning dans la pratique avec Sam Bessalah
12/01/2015 • 42 minutes 26 seconds
Episode 09 : Mongodb avec Tugdual Grall
30/12/2014 • 1 hour 15 seconds
Episode 08 : NOSQL avec Sam Bessalah
18/12/2014 • 44 minutes 53 seconds
Episode 07 : Apache Cassandra avec Victor Coustenoble
25/11/2014 • 41 minutes 55 seconds
Episode 06 : Datascience et Challenges Kaggle avec Christophe Bourguignat.
16/11/2014 • 40 minutes 50 seconds
Episode 05 : Hadoop et Talend avec Cédric Carbone.
20/10/2014 • 56 minutes 21 seconds
Episode 04 : Azure Machine Learning par Benjamin Guinebertière.
26/09/2014 • 1 hour 6 minutes 5 seconds
Episode 03 : Ubeeko et HFactory avec Ghislain Mazars
05/09/2014 • 1 hour 5 minutes 50 seconds
Episode 02 : Retour sur Google I/O avec William Vambenepe
02/07/2014 • 35 minutes 4 seconds
Episode 01 : Azure ML, Pig, Hadoopsummit et Actualités.