Toute l'actualité du Bigdata et surtout de sa communauté francophone dans un podcast.
Episode 206 : portes ouvertes chez OpenAI
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/episode-206-portes-ouvertes-chez-openaiRetrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube
18-10-2024 • 50 minuten, 54 seconden
Episode 205 : Kestra avec Ludovic Dehon
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-205-Kestra-avec-Ludovic-DehonRetrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube
27-9-2024 • 1 uur, 14 minuten, 17 seconden
Episode 204 : 70 milliards de réflections
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-204-70-milliards-de-relections/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.comEt sur la chaine Youtube ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous !Le générique a été composé et réalisé par Maxence Lecointe
14-9-2024 • 48 minuten, 6 seconden
Episode 203 : Pas de trêve olympique pour les LLMs
Les shownotes de cet épisode sont à retrouver surhttps://bigdatahebdo.com/podcast/episode-203-pas-de-treve-olympique-pour-les-llms/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous !Le générique a été composé et réalisé par Maxence Lecointe
1-8-2024 • 48 minuten, 51 seconden
Episode 202 : Data Architecture avec Frédéric Brossard de Dcube
Retrouvez les shownotes de cet épisode sur https://bigdatahebdo.com/podcast/episode-202-data-architecture-avec-frederic-brossard-de-dcube/ ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. Le générique a été composé et réalisé par Maxence Lecointe
27-7-2024 • 1 uur, 12 minuten, 30 seconden
Episode 201 : Snowflake Summit 24 - part 2 ML et Generative AI
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-201-snowflake-summit-24-part-2-ml-et-genai/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
16-7-2024 • 56 minuten, 51 seconden
Episode 200 : Snowflake Summit 24 part 1 Data-Engineering
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-200-snowflake-summit-24-part-1-data-engineering/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
9-7-2024 • 55 minuten
Episode 199 : Databricks Data & AI Summit 2024
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-199-databricks-dais-2024/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
2-7-2024 • 1 uur, 7 minuten, 36 seconden
Episode 198 : IA Gen et Anssi
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-198-ia-gen-et-anssi/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
25-6-2024 • 33 minuten, 35 seconden
Episode 197 : GLADIA avec Jean-Louis Queguiner
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-197-gladia-avec-jean-louis-queguiner/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
11-6-2024 • 1 uur, 19 minuten, 30 seconden
Episode 196 : python, duckdb, etc...
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-196-python-news-et-autres/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
4-6-2024 • 35 minuten, 48 seconden
Episode 195 : DBT avec Florian Eiden
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-195-dbt-avec-florian-eiden------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
28-5-2024 • 1 uur, 13 minuten, 51 seconden
Episode 194 : Self Service Data - Tristan Mayer - CastorDoc
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-194-self-service-data-avec-tristan-mayer/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
21-5-2024 • 56 minuten, 35 seconden
Episode 193 : Microsoft Fabric avec Marie Aubert
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-193-microsoft-fabric-avec-marie-aubert------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
14-5-2024 • 1 uur, 6 minuten, 15 seconden
Episode 192 : DuckDB et autres avec Christophe Blefari
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-192-duckdb-et-autres-avec-christophe-blefari------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
10-5-2024 • 1 uur, 10 minuten, 52 seconden
Episode 191 : Popsink avec Benjamin Djidi
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-191-popsink-avec-benjamin-djidi ------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
29-4-2024 • 1 uur, 2 minuten, 21 seconden
Episode 190 : Databricks DBRX avec Quentin Ambard
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-190-databricks-dbrx-avec-quentin-ambard------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
22-4-2024 • 50 minuten, 31 seconden
Episode 189 : la compta du futur et autres news
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-189-la-compta-du-futur-et-autres-news/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
8-4-2024 • 59 minuten, 47 seconden
Episode 188 : Data-Ops avec Matthieu Rousseau
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-188-data-ops-avec-matthieu-rousseau/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
29-3-2024 • 50 minuten, 18 seconden
Episode 187 : La data chez Nickel avec Paul Marcombes
20-3-2024 • 58 minuten, 26 seconden
Episode 186 : plus jQuery que Terraform
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-186-plus-jquery-que-terraform/------------------Cette publication est sponsorisée par Datatask et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
9-3-2024 • 1 uur, 6 minuten, 57 seconden
Episode 185 : C'est génial jusqu'au moment ou c'est plus génial
* La Nuit de la Data et de l'IA - And the winners are... : -> https://www.republikgroup-it.fr/palmares-2024-tda* IA ACT * Probabl is a new AI company built around popular library scikit-learn -> https://techcrunch.com/2024/02/01/probabl-is-a-new-ai-company-built-around-popular-library-scikit-learn/* From Silos to Standardization: Leveraging DBT for a Democratized Data Framework -> https://medium.com/uc-engineering/from-silos-to-standardization-leveraging-dbt-for-a-democratized-data-framework-f444dcd07cd9* DuckDB vs Polars -> https://medium.com/gitconnected/duckdb-vs-polars-2ff19cc7af41* Meetup Python sur les frameworks UI -> https://youtu.be/yspHNEFjKfQ?list=PLv7xGPH0RMUT1GSCGHJmqnswpk-nyz5aq* NiceGUI -> https://nicegui.io------------------Cette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
1-3-2024 • 53 minuten, 12 seconden
Episode 184 : Pour une poignée de dollars
Shownotes sur : https://bigdatahebdo.com/podcast/episode-184-pour-une-poignee-de-dollars/
15-2-2024 • 58 minuten, 54 seconden
Episode 183 : Promptologues de l'infra
### Promptologues* How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb* Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/* embedchain/embedchain: The Open Source RAG framework -> https://github.com/embedchain/embedchain* A Guide to Large Language Model Abstractions - Two Sigma -> https://www.twosigma.com/articles/a-guide-to-large-language-model-abstractions/### Data eng* How to Scale Your Data Pipelines and Data Products with Contract Testing and Dbt -> https://towardsdatascience.com/how-to-scale-your-data-pipelines-and-data-products-with-dbt-and-contract-testing-10c92ea9a443* dbt Alternatives -> https://www.greenmountaindatasolutions.com/blog/alternatives-to-dbt-data-build-tool
9-2-2024 • 35 minuten, 43 seconden
Episode 182 : Zuck fabric une AGI avec des data-contracts
Shownotes sur : https://bigdatahebdo.com/podcast/episode-182-zuck-fabric-une-agi-avec-des-data-contracts/
3-2-2024 • 47 minuten, 37 seconden
Episode 181 : Le Maestro du GPT Store
Shownotes sur : https://bigdatahebdo.com/podcast/episode-181-le-maestro-du-gptstore/
Episode 179 : 2023 en revue et quelques prédictions pour 2024
29-12-2023 • 1 uur, 28 minuten, 4 seconden
Episode 178 : Q Re-invent tout AWS
12-12-2023 • 1 uur, 6 minuten, 37 seconden
Episode 177 : Je ne sais pas
### LLM fever* [GAIC-fr] Analyse des annonces IA de MS Ignite -> https://www.youtube.com/watch?v=rJTcJHh6bcY* LightOn annonce la seconde version d’Alfred, son modèle LLM open-source -> https://www.actuia.com/actualite/lighton-annonce-la-seconde-version-dalfred-son-modele-llm-open-source/* Introducing Claude 2.1 -> https://www.anthropic.com/index/claude-2-1* Welcome to the Hallucination Index! -> https://www.rungalileo.io/hallucinationindex### data-engineering* Multithreading Framework for Data Ingestion -> https://awstip.com/multithreading-framework-for-data-ingestion-3c3c8480b8d0* Talend Open Studio c'est fini au 31/1/202 -> https://community.talend.com/s/question/0D55b00009OuDGPCA3/update-on-the-future-of-talend-open-studio?language=en_US* MotherDuck: Making PySpark Code Faster with DuckDB -> https://motherduck.com/blog/making-pyspark-code-faster-with-duckdb* How to Extract Data Observability Metrics from Snowflake Using SQL -> https://towardsdatascience.com/how-to-extract-data-observability-metrics-from-snowflake-using-sql-9bf001038788
5-12-2023 • 51 minuten, 18 seconden
Episode 176 : Il n'y a pas que les modèles qui hallucinent
### LLM fever* Kyutai, le laboratoire d'intelligence artificielle en mode science ouverte -> https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/kyutai-le-laboratoire-d-intelligence-artificielle-en-mode-science-ouverte-qui-veut-concurrencer-les-gafam_175123* ChatGPT Réinventé: comment le faire philosopher pour améliorer ses résultats -> https://generationia.flint.media/p/step-back-prompting-reculer-pour-mieux-sauter* Microsoft optimise Azure avec ses propres puces d’IA -> https://www.actuia.com/actualite/microsoft-optimise-azure-avec-ses-propres-puces-dia/### Data-eng* data load tool (dlt) -> https://dlthub.com/* Microsoft and Google join forces on OneTable, an open-source solution for data lake challenges -> https://venturebeat.com/data-infrastructure/exclusive-microsoft-and-google-join-forces-on-onetable-an-open-source-solution-for-data-lake-challenges/------------------Cette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
27-11-2023 • 51 minuten, 26 seconden
Episode 175 : Evaluateur de LLM
* Why can't datacenter operators stop thinking about atomic power? -> https://www.theregister.com/2023/09/27/datacenters_nuclear_power### LLM fever* Evaluate LLMs and RAG a practical example using Langchain and Hugging Face -> https://www.philschmid.de/evaluate-llm* Introducing the Giskard Bot: Enhancing LLM Testing & Debugging on Hugging Face -> https://huggingface.co/blog/JMJM/giskard-llm-testing-and-debugging-hf* Introducing Canopy: An easy, free, and flexible RAG framework powered by Pinecone -> https://www.pinecone.io/blog/canopy-rag-framework/### Tools* Pijul -> https://pijul.org/* Pijul la théorie -> https://pijul.org/manual/theory.html### meetup* "Ou va la modern Data Stack ?" le 31 janvier 2024 chez Criteo -> https://www.linkedin.com/company/modern-data-stack-france/------------------Cette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
20-11-2023 • 42 minuten, 59 seconden
Episode 174 : OpenAI devday 2023
* ⚠️ Don't try this at home: CSS _as_ the backend - introducing Cascading Server Sheets! -> https://dev.to/thormeier/dont-try-this-at-home-css-as-the-backend-what-3oih### LLM fever* Open AI Dev day 2024 -> https://openai.com/blog/new-models-and-developer-products-announced-at-devday* Knowledge Distillation: Principles, Algorithms, Applications -> https://neptune.ai/blog/knowledge-distillation* Quand la boîte noire des IA génératives livre ses secrets -> https://www.lexpress.fr/amp/economie/high-tech/quand-la-boite-noire-des-ia-generatives-livre-ses-secrets-BFUANKGCOZF2DDGJRNFDNAVHZU/### Data-Science* Hidden Markov Models Explained with a Real Life Example and Python code -> https://medium.com/towards-data-science/hidden-markov-models-explained-with-a-real-life-example-and-python-code-2df2a7956d65### Data-eng* Open Data Contract Standard -> https://github.com/bitol-io/open-data-contract-standard* Twitter’s Owner Elon Musk refuses to pay Google Cloud Bill -> https://medium.com/codex/twitters-owner-elon-musk-refuses-to-pay-google-cloud-bill-8e0ec1030101
13-11-2023 • 49 minuten, 12 seconden
Episode 173 : L'arbre qui cache la forêt aléatoire
### Data-science* XGBoost 2.0: New Tool for Training Better AI Models on More Complex Data -> https://aibusiness.com/ml/xgboost-2-0-new-tool-for-training-better-ai-models-on-more-complex-data* Semantic link in Microsoft Fabric: Bridging BI and Data Science -> https://blog.fabric.microsoft.com/en-us/blog/semantic-link-use-fabric-notebooks-and-power-bi-datasets-for-machine-learning-data-validation-and-more* Mastering Customer Segmentation with LLMs -> https://towardsdatascience.com/mastering-customer-segmentation-with-llm-3d9008235f41### Tools* ELT with Meltano (PostgreSQL -> Snowflake) -> https://medium.com/@danthelion/elt-with-meltano-postgressql-snowflake-a543c077ae1a* Fast, Git Friendly API Client -> https://www.usebruno.com------------------Cette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
30-10-2023 • 48 minuten, 12 seconden
Episode 172 : ça souffle toujours sur les LLMs
### LLM fever* Zephyr 7B -> https://www.linkedin.com/posts/lewis-tunstall_heres-a-simple-recipe-to-train-a-7b-model-activity-7117523535991857152-LuYg/?utm_source=share&utm_medium=member_desktop* Bing Chat Enterprise -> Your AI-Powered Chat for Work | Bing Chat Enterprise (microsoft.com)* promptflow -> promptflow/examples/tutorials/e2e-development/chat-with-pdf.md at main · microsoft/promptflow (github.com)* n8n langchain -> https://n8n.io/workflows/1959-ailangchain-ai-chatbot-that-can-query-the-web/### Data-eng* DuckDB Extensions for AWS Lambda -> https://extensions.quacking.cloud/* Build Data Lake Pipelines with Google Pub/Sub -> https://medium.com/illumination/build-data-lake-pipelines-with-google-pub-sub-6ecb8da87c08* Kestra has raised $3 million -> https://www.linkedin.com/posts/ludovic-dehon_opensource-activity-7115612770783350785-6nGr/* Terraform @ scaleway -> https://datatask.io/blog/scaleway-terraform/------------------Cette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
23-10-2023 • 46 minuten
Episode 171 : ChatGPT on lui parle poliment
Linkedin Live avec Paul : Embeddings audio & image avec Serge Retkowsky -> https://www.linkedin.com/events/7101846404389580800/comments/### LLM* First Impressions with GPT-4V(ision) -> https://blog.roboflow.com/gpt-4-vision/* Expanding access to safer AI with Amazon -> https://www.anthropic.com/index/anthropic-amazon* AutoGen: Enabling next-generation large language model applications -> https://www.microsoft.com/en-us/research/blog/autogen-enabling-next-generation-large-language-model-applications/### Cloud* Motherduck (managed DBT) pricing -> https://motherduck.com/pricing/* Real-time Analytics with Snowflake Dynamic Tables & Redpanda -> https://www.arecadata.com/real-time-analytics-with-dynamic-tables-in-snowflake-redpanda/* Announcing BigQuery Omni cross-cloud joins -> https://cloud.google.com/blog/products/data-analytics/announcing-bigquery-omni-cross-cloud-joinsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
16-10-2023 • 44 minuten, 45 seconden
EP170 : le Vent tourne pour les LLM
### LLM* Mistral 7B is here! -> https://mistral.ai/product/* What's going on with the Open LLM Leaderboard? -> https://huggingface.co/blog/evaluating-mmlu-leaderboard* How do I use ChatGPT Browse with Bing to search the web? -> https://help.openai.com/en/articles/8077698-how-do-i-use-chatgpt-browse-with-bing-to-search-the-web* Meta AI assistant uses Microsoft Bing Search results -> https://searchengineland.com/meta-ai-assistant-uses-microsoft-bing-search-results-432565* The iliad Group is making strategic investments in Artificial Intelligence -> https://s3.fr-par.scw.cloud/iliad-strapi/DP_iliad_AI_260923_Eng_462ff3265c.pdf### Cloud and DBs* Announcing DuckDB 0.9.0 -> https://duckdb.org/2023/09/26/announcing-duckdb-090.html* A Guide To The Snowflake Results Cache -> https://teej.ghost.io/a-guide-to-the-snowflake-results-cache/Cette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
10-10-2023 • 44 minuten, 57 seconden
Episode 169 : LLM est un consultant comme les autres
* Modern Data Stack Meetup : Streamlit + Kestra### Gen AI* Deploy Your LLM Chatbot With Retrieval Augmented Generation (RAG), llama2-70B (MosaicML inferences) and Vector Search -> https://www.databricks.com/resources/demos/tutorials/data-science-and-ai/lakehouse-ai-deploy-your-llm-chatbot?itm_data=demo_center* LLMs in Action: A Practical Guide for Software Architects and Developers -> https://www.linkedin.com/pulse/llms-action-practical-guide-software-architects-s%C3%A9bastien-brasseur?utm_source=share&utm_medium=member_ios&utm_campaign=share_via* Lantern — a PostgreSQL vector database for building AI applications -> https://docs.lantern.dev/blog/2023/09/13/hello-world### Data science* Announcing Python in Excel: Combining the power of Python and the flexibility of Excel. -> https://techcommunity.microsoft.com/t5/excel-blog/announcing-python-in-excel-combining-the-power-of-python-and-the/ba-p/3893439* NEW Python in Excel - PYTHON + EXCEL + ChatGPT = Easy! -> https://youtu.be/-_1IaUjO-hk?si=ZA8-ztkfzQfA3cc0* Excel Just Got Python | Prime Reacts -> https://youtu.be/iAQJhYQEx-s?si=l_v3YC8o01Vyyar6### Cloud Native* Kubernetes OWASP Top 10: Secrets Management -> https://itnext.io/kubernetes-owasp-top-10-secrets-management-c996faa87b47Agenda* Bigdatapero à Paris 27/09/2023Cette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
19-9-2023 • 1 uur, 11 minuten, 25 seconden
Episode 168 : Si t'as pas ta vectordb en 2023...
### Tools* Ruff -> https://beta.ruff.rs/docs/### Cloud* Mountpoint for Amazon S3 -> https://aws.amazon.com/blogs/aws/mountpoint-for-amazon-s3-generally-available-and-ready-for-production-workloads/### Time Series* Is Flux being deprecated with InfluxDB 3.0? -> https://community.influxdata.com/t/is-flux-being-deprecated-with-influxdb-3-0/30992/8?u=pauldix* Timeseries dans le podcast AWS en Français -> https://aws.amazon.com/fr/blogs/france/podcasts/### Database* Awesome DuckDB -> https://github.com/davidgasquez/awesome-duckdb### GenAI* RAG vs Finetuning — Which Is the Best Tool to Boost Your LLM Application? -> https://towardsdatascience.com/rag-vs-finetuning-which-is-the-best-tool-to-boost-your-llm-application-94654b1eaba7* Best practices for your ChatGPT ‘on your data’ solution -> https://medium.com/@imicknl/how-to-improve-your-chatgpt-on-your-data-solution-d1e842d87404* OpenAI, maker of ChatGPT, reportedly nears $1 billion in annual sales -> https://www.fastcompany.com/90946849/openai-chatgpt-reportedly-nears-1-billion-annual-sales?partner=rss&utm_source=feedly&utm_medium=feed&utm_campaign=rss+fastcompany&utm_content=rss?utm_source=tldrnewsletter### Vector DB* Jina-AI -> https://github.com/jina-ai/vectordb* Redis 7.2 LLM / VectorDB features -> ttps://redis.com/blog/introducing-redis-7-2/* AlloyDB -> https://techcrunch.com/2023/08/29/googles-alloydb-ai-transforms-databases-to-power-generative-ai-apps/?utm_source=substack&utm_medium=email&guccounter=2* Pinecone -> https://www.pinecone.io/blog/azure/?hss_channel=lcp-20299330&utm_content=256569107&utm_medium=social&utm_source=linkedin* pgvector -> https://jkatz05.com/post/postgres/pgvector-overview-0.5.0/* Vector Search Isn’t Enough | BRKFP301H -> https://www.youtube.com/watch?v=5Qaxz2e2dVg### AI* AWS Entity Resolution: Match and Link Related Records from Multiple Applications and Data Stores | AWS News Blog -> https://aws.amazon.com/blogs/aws/aws-entity-resolution-match-and-link-related-records-from-multiple-applications-and-data-stores/### Agenda* Timeseries France 13/09/2023 -> https://timeseries.fr/edition/timeseriesfr-18/* Bigdatapero à Paris 27/09/2023 ->Cette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
5-9-2023 • 1 uur, 17 minuten, 32 seconden
Episode 167 : Snowflake
Dans cet épisode nous accueillons Ilyes Mehaddi de Snowflake pour nous parler de Snowflake Data Cloud et des annonces du SummitRetrouvez Ilyes sur le slack du bigdatahebdo ou alors sur son blogData Cloud World Tour : 5 octobre à Paris Recap du Summit 2023 par secteurs d’activités Recap des annonces du Summit 2023 SponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
27-7-2023 • 1 uur, 39 minuten, 15 seconden
Episode 166 : Databricks Data + AI Summit 2023 avec Quentin Ambard (part 2/2)
Encore une fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverserRetrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/# Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Paul : [@paulpeton](https://twitter.com/paulpeton) et [methodidacte](https://methodidacte.org)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi au [Time Series France](https://www.timeseries.fr/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), [Datatask](https://datatask.io/))Consulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe
24-7-2023 • 42 minuten, 10 seconden
Episode 166 : Databricks Data + AI Summit 2023 avec Quentin Ambard (part 1/2)
Encore un fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverserRetrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/# Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Paul : [@paulpeton](https://twitter.com/paulpeton) et [methodidacte](https://methodidacte.org)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi au [Time Series France](https://www.timeseries.fr/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), [Datatask](https://datatask.io/))Consulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe
15-7-2023 • 1 uur, 11 minuten, 8 seconden
Episode 165 : Generative duck phone number
### Apéro* Voxxed Days Luxembourg ->* Numéros pour œuvres audiovisuelles -> https://www.arcep.fr/uploads/tx_gsavis/21-0532.pdf### ML* Gladia -> http://app.gladia.io/* Microsoft Orca 13B -> https://intelligence-artificielle.developpez.com/actu/345575/Microsoft-AI-presente-Orca-un-modele-a-13-milliards-de-parametres-qui-apprend-a-imiter-le-processus-de-raisonnement-des-grands-modeles-fondamentaux-ses-performances-egalent-celles-de-ChatGPT/* Image Joint Embedding Predictive Architecture -> Cette nouvelle IA de Meta serait capable de raisonner comme un humain (clubic.com)* Grounding et RAG -> Grounding LLMs - Microsoft Community Hub* Ask your own data -> https://methodidacte.org/2023/06/ajoutez-vos-donnees-a-chatgpt/### DB* Announcing MotherDuck -> https://motherduck.com/blog/announcing-motherduck-duckdb-in-the-cloud/* Build SQL pipelines to BigQuery with Dataform -> https://cloud.google.com/blog/products/data-analytics/introducing-dataform-in-ga/### Green IT* Azure/carbon-aware-keda-operator -> https://github.com/Azure/carbon-aware-keda-operator### Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Paul : [@paulpeton](https://twitter.com/paulpeton) et [methodidacte](https://methodidacte.org)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi au [Time Series France](https://www.timeseries.fr/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), [Datatask](https://datatask.io/))Consulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe
8-7-2023 • 59 minuten, 33 seconden
Episode 164 : Que fabric santa Nadella ?
Retour sur la MS Build 2023 avec Charles-Henri Sauget MVP Microsofthttps://learn.microsoft.com/en-us/fabric/get-started/microsoft-fabric-overviewSponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
29-6-2023 • 1 uur, 22 minuten, 30 seconden
Episode 163 : On fait de l'informatique pour ne pas avoir à parler aux gens
* Google I/O '23 in under 10 minutes -> https://www.youtube.com/watch?v=hleLlcHwQLM&list=TLGGCy91ScdjTPYyNjA1MjAyMw&index=2* Google "We Have No Moat, And Neither Does OpenAI" -> https://www.semianalysis.com/p/google-we-have-no-moat-and-neither* Google demande à ses chercheurs d'arrêter de partager leurs travaux -> https://www.nextinpact.com/lebrief/71669/google-demande-a-ses-chercheurs-darreter-partager-leurs-travaux* Multilingual speech to text -> https://ai.facebook.com/blog/multilingual-model-speech-recognition/* Tableau Jumps Into Generative AI with Tableau GPT -> https://www.datanami.com/2023/05/09/tableau-jumps-into-generative-ai-with-tableau-gpt/* Sklearn Meets Large Language Models -> https://github.com/iryna-kondr/scikit-llmSponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
1-6-2023 • 56 minuten, 50 seconden
Episode 162 : WARP10 3.0 avec Mathias Herberts
Warp 10 sors dans sa version 3, Mathias Herberts est avec nous pour en parlerQuelques blogs de la société Senx sur Warp 10 : https://blog.senx.io/tag/warp-10-3-x/Mathias était déjà venu nous parler de Warp 10 dans l'épisode 72 (https://bigdatahebdo.com/podcast/episode-72-warp-10-avec-mathias-herberts/)Pour en savoir plus sur Foundation DB il y a l'épisode 93 (https://bigdatahebdo.com/podcast/episode-93-foundation-db/)Suivez Mathias Herberts sur Twitter : [@herberts](https://twitter.com/herberts)
24-5-2023 • 1 uur, 38 minuten, 41 seconden
Episode 161 : La semaine dernière a été une année importante
### Apéro* Nouveau métier dans l'IA: C3PO -> https://podcast.ausha.co/le-podcast-des-eclaireurs/c3po-ce-metier-qui-va-sauver-les-journalistes### GenAI* Microsoft JARVIS / HuggingGPT -> https://analyticsindiamag.com/microsoft-jarvis-is-the-path-towards-agi/* New ways to manage your data in ChatGPT -> https://openai.com/blog/new-ways-to-manage-your-data-in-chatgpt### Vector DB* What is a Vector Database? -> What is a Vector Database? - Zilliz Vector database learn* Chroma the AI-native open-source embedding database -> https://www.trychroma.com### Cloud* Augmentation Bigquery la suite -> ### Databases* MySQL Locking Reads -> https://vincepergolizzi.com/programming/2020/09/02/mysql-locking-reads.html* CLickhouse -> https://affini-tech.com/blog/clickhouse/
9-5-2023 • 1 uur, 15 minuten, 3 seconden
BigdataHebdo Live à DevoxxFR 2023
Merci à l'équipe DevoxxFR de nous avoir accueilli pour cet enregistrementMerci à nos auditeurs qui nous ont rejoins, pour leur contributions et leur bonne humeur.
1-5-2023 • 48 minuten, 9 seconden
EP159 : Il n'y a pas que ChatGPT
### Apero* JChateau -> https://www.jchateau.org/### IA Generatives* GPT4 -> "* ChatGPT : L'ère de l'IA a commencé !(phil_it avec la participation de Paul Péton) -> https://youtu.be/P-1sONuhNnQ"* Hello Dolly: Democratizing the magic of ChatGPT with open models -> https://www.databricks.com/blog/2023/03/24/hello-dolly-democratizing-magic-chatgpt-open-models.html* Microsoft licencie son équipe en charge de l’éthique sur l’IA -> https://www.nextinpact.com/lebrief/71230/microsoft-licencie-son-equipe-dediee-a-lethique-lia### Databases* New UUID Formats -> https://uuid6.github.io/uuid6-ietf-draft/* A Universally Unique IDentifier (UUID) URN Namespace -> https://www.ietf.org/archive/id/draft-ietf-uuidrev-rfc4122bis-00.html* Snowflake Micro-partitions & Table Clustering -> https://medium.com/snowflake/snowflake-micro-partitions-table-clustering-74beabaf780f* Event driven architecture with AWS DynamoDB Streams -> https://youtube.com/watch?v=vYf_v4n0a4w&feature=share"* DataFusion Spark Polars DuckDB Clickhouse-> https://colab.research.google.com/drive/1pfAPpIG7jpvGB_aHj-PXX66vRaRT0xlj#scrollTo=JziMdMTGBpLD"* Pandas 2.0 is Here (Coming Soon) -> https://medium.com/@darshilp/pandas-2-0-is-here-427b026ab913* New BigQuery editions: flexibility and predictability for your data cloud -> https://cloud.google.com/blog/products/data-analytics/introducing-new-bigquery-pricing-editions* Exploring the TPC-DS Benchmark Queries with Malloy -> https://carlineng.com/?postid=malloy-tpcds#blog### Visualisation* VegaFusion -> https://vegafusion.io/index.html* Datapane -> https://docs.datapane.com
11-4-2023 • 1 uur, 24 minuten, 24 seconden
Episode 158 : Si tu n'existes pas dans Chat GPT, tu n'existes pas
Apero* Des soldats trompent des robots avec une ruse de Metal Gear Solid -> https://www.numerama.com/pop-culture/1244300-des-soldats-trompent-des-robots-avec-une-ruse-de-metal-gear-solid.html### IA Generatives* Reinforcement Learning with Human Feedback -> https://huggingface.co/blog/rlhf* La délicate question du sous-traitement des données d'entraînement de l'IA -> https://www.nextinpact.com/article/70384/la-delicate-question-sous-traiter-donnees-dentrainement-lia?utm_source=pocket_reader### Database (DBT) * Announcing DuckDB 0.7.0 -> https://duckdb.org/2023/02/13/announcing-duckdb-070.html* Est ce que vous avez des bigdata (bigdata is dead par jordan tigrani) ? -> https://motherduck.com/blog/big-data-is-dead/* dbt Labs Signs Definitive Agreement to Acquire Transform, Accelerating Development of the dbt Semantic Layer -> https://www.prnewswire.com/news-releases/dbt-labs-signs-definitive-agreement-to-acquire-transform-accelerating-development-of-the-dbt-semantic-layer-301741620.html
9-4-2023 • 1 uur, 6 minuten, 20 seconden
Episode 157 : ML avec OVH Cloud
Cette semaine on parle de ML avec OVH CloudComment OVH Cloud étoffe sa gamme deservice pour répondre aux challenges du ML dans le Cloud.AI Machine Learning @ OVHhttps://www.ovhcloud.com/fr/public-cloud/ai-machine-learning/Workshop écrit par Bastien pour travailler avec DBT sur OVH Cloudhttps://dbt-postgresql-metabase-workshop.pages.dev/ Invités :Elea Petton@eleapettonhttps://www.linkedin.com/in/elea-petton/Bastien Verdebout@BastienOvhhttps://www.linkedin.com/in/bastienverdebout/Equipe :Jérôme : @jxerome et ZeeneaPaul : @paulpetonVincent : @vhe74, Affini-Tech et DatataskSponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Paris Time Series Meetup.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask)Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
30-3-2023 • 1 uur, 21 minuten, 55 seconden
Episode 156 : Quickwit avec Paul Masurel et François Massot
Episode spécial Quickwit Quickwit https://quickwit.io/avec Paul Masurel (https://twitter.com/fulmicoton) et François Massot (https://twitter.com/FrancoisMassot)
12-3-2023 • 1 uur, 17 minuten, 16 seconden
Episode 155 : Bilan et prédictions de début d'année (en retard)
OrateursAlexander : @alexanderdejaJérôme : @jxerome et ZeeneaNicolas: @nsteinmetz, CerenIT, Paris Time Series MeeupVincent : @vhe74, Affini-Tech et DatataskPaul : @paulpetonSponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Paris Time Series Meetup.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask)Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe
11-3-2023 • 1 uur, 13 minuten, 57 seconden
Episode 154 : Re-Invente moi des histoires
### Apero* Paul tu nous reserves une petite anecdote sur le monde IT -> * Le podcast AWS en français AWS re:Invent re:Cap (136, 137, 138) -> https://aws.amazon.com/fr/blogs/france/podcasts/* The best UUID type for a database Primary Key -> https://vladmihalcea.com/uuid-database-primary-key/* TSID Creator -> https://github.com/f4b6a3/tsid-creator### ML* Manage Azure Machine Learning registries -> https://learn.microsoft.com/en-us/azure/machine-learning/how-to-manage-registries?tabs=cli### AI* Meta débranche Galactica, IA génératrice de textes scientifiques -> https://www.lebigdata.fr/raciste-folle-ia-meta-galactica#:~:text=L'IA%20Galactica%20de%20Meta,web%20scientifiques%20et%20d'encyclop%C3%A9dies.* Meta AI présente CICERO, un agent d’IA capable de négocier et coopérer avec les humains -> https://www.actuia.com/actualite/meta-ai-presente-cicero-un-agent-dia-capable-de-negocier-et-cooperer-avec-les-humains/### Langage* Writing Faster Python 3 - presented by Sebastian Witowski -> https://youtu.be/6P68IBou_cg* switowski/writing-faster-python3 -> https://github.com/switowski/writing-faster-python3
7-2-2023 • 1 uur, 8 minuten, 51 seconden
Episode 153 : Couchbase avec Laurent Doguin
Couchbase avec Laurent DoguinEssayez Couchbase sur Capella https://cloud.couchbase.comOu le playground https://couchbase.live/Ou dans Gitpod avec du GraphQL https://gitpod.io/#https://github.com/ldoguin/couchbase-graphql-travelVenez nous voir sur Discord: https://discord.gg/jJfT4pDU6zOn reprend les meetups https://www.meetup.com/couchbase-france/ML Meets NoSQL: Integrating Python User-Defined Functions with N1QL for Analyticshttps://www.couchbase.com/blog/ml-meets-nosql-integrating-python-user-defined-functions-with-n1ql-for-analytics/On recrute https://www.couchbase.com/careers/open-positions
20-12-2022 • 1 uur, 34 minuten, 19 seconden
Episode 152 : pour quelques secondes d'assembleur de plus
### Apero* RIP: Kathleen Booth, the inventor of assembly language -> https://www.theregister.com/2022/10/29/kathleen_booth_obit/### Database * Announcing DuckDB 0.6.0 -> https://duckdb.org/2022/11/14/announcing-duckdb-060.html* MotherDuck secures investment from Andreessen Horowitz to commercialize DuckDB -> https://techcrunch.com/2022/11/15/motherduck-secures-investment-from-andreessen-horowitz-to-commercialize-duckdb/?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAAMa_uQIIoy4B2Du-vv8Yrte7j-XUutdOhK591njsXl6BWjq--a1hohf-0ohS1Q78gOPSAWFe_kSDwOzutnQLOoVvO15Pq4YgEZSEaRx48AWl-mBNccaUya6f97UYpQYlIgS6uVQfhWark_b58TnXvQhp3caKEWAijNsSjVtRhGEO### Cloud* OVH abandonne GCP Anthos -> * How we reduced our annual server costs by 80% — from $1M to $200k — by moving away from AWS -> https://levelup.gitconnected.com/how-we-reduced-our-annual-server-costs-by-80-from-1m-to-200k-by-moving-away-from-aws-2b98cbd21b46* The Distributed Computing Manifesto | All Things Distributed -> https://www.allthingsdistributed.com/2022/11/amazon-1998-distributed-computing-manifesto.html* Introducing the Docker+Wasm Technical Preview -> https://www.docker.com/blog/docker-wasm-technical-preview/### Data-Science* Streamlit Elements You Should Know About in 2022 -> https://youtube.com/watch?v=_Um12_OlGgw&feature=share### Procès * GitHub Copilot litigation · Joseph Saveri Law Firm & Matthew Butterick -> https://githubcopilotlitigation.com/### Divers* Le Système international d’unités évolue, la seconde et l'UTC en travaux -> https://www.nextinpact.com/article/70440/le-systeme-international-dunites-evolue-seconde-et-utc-en-travaux* Résolutions de la Conférence générale des poids et mesures (27e réunion) -> https://www.bipm.org/fr/search?_search_portlet_dlFileId=77765681&_search_portlet_source=BIPM&p_p_cacheability=cacheLevelPage&p_p_id=search_portlet&p_p_lifecycle=2&p_p_lifecycle=1&p_p_mode=view&p_p_resource_id=%2Fdownload%2Fpublication&p_p_state=normal
8-12-2022 • 1 uur, 9 minuten, 49 seconden
Episode 151 : Nicolas @ Flovea et quelques News
### Flovea### Time Series* Welcome to InfluxDB IOx: InfluxData’s New Storage Engine -> https://www.influxdata.com/blog/influxdb-engine/### Big Data* Mort d’Hadoop : le marché se trompe selon le TOSIT -> https://www.lemagit.fr/actualites/252525812/Mort-dHadoop-une-affirmation-prematuree-selon-le-TOSIT### DBT* Coalesce 2022 : dbt Semantic Layer -> https://www.prnewswire.com/news-releases/dbt-labs-launches-the-dbt-semantic-layer-enabling-greater-consistency-across-analytics-tools-301652226.html* Coalesce 2022 : replays -> https://www.youtube.com/playlist?list=PL0QYlrC86xQlj9UDGiEwhXQuSjuSyPJHl### Duckdb* Seattle data guy duckdb -> https://www.youtube.com/watch?v=vrjDyxWQTJ4&t=1732s* dbt-duckdb · PyPI -> https://pypi.org/project/dbt-duckdb/SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
5-12-2022 • 1 uur, 15 minuten, 54 seconden
Episode 150 : l'histoire de ce Podcast et Datatask
L'équipe interview Vincent Heuschling pour revenir sur ces années de Podcast et présenter la plateforme DatataskSponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
22-11-2022 • 1 uur, 22 minuten, 10 seconden
Episode 149 : vos données sont tabulaires, ne faites pas de Deep Learning
### Apéro* Retour Bigdata Paris* Retour Salon Data Nantes * We Spoke With the Last Person Standing in the Floppy Disk Business -> https://eyeondesign.aiga.org/we-spoke-with-the-last-person-standing-in-the-floppy-disk-business/### Database tooling* Adding Data Observability and Alerts to your Data Pipeline is easier than you think -> https://blog.infuseai.io/adding-data-observability-and-alerts-to-your-data-pipeline-is-easier-than-you-think-4e005daca55b* Monitor your dbt tests results and add Elementary anomaly detection tests to your dbt project. -> https://github.com/elementary-data/elementary* re_data is an open-source data reliability framework for modern data stack. -> https://docs.getre.io/latest/docs/re_data/introduction/whatis_data/* The many layers of data lineage. What can we learn from google maps to… -> https://medium.com/data-monzo/the-many-layers-of-data-lineage-2eb898709ad3### AI Images* DALL·E now available -> https://openai.com/blog/dall-e-now-available-without-waitlist/* DALL·E: Introducing Outpainting -> https://openai.com/blog/dall-e-introducing-outpainting/* Meta AI : make a video -> http://makeavideo.studio/* Apply professional studio lights to your photos in seconds -> https://clipdrop.co/relight---------SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
30-9-2022 • 1 uur, 15 minuten, 22 seconden
Episode 148 : Trino avec Victor Coustenoble
On reçoit cette dans cet épisode Victor Coustenoble pour nous parler de Trino.Rebranding PrestoSQL as Trino https://trino.io/blog/2020/12/27/announcing-trino.htmlHappy tenth birthday Trino!https://trino.io/blog/2022/08/08/trino-tenth-birthday.htmlTrino's tenth birthday celebration recaphttps://trino.io/blog/2022/09/12/tenth-birthday-celebration-recap.htmlA decade of query engine innovationhttps://trino.io/blog/2022/08/04/decade-innovation.htmlOrateursVictor : @victorcousteAlexander : @alexanderdejaVincent : @vhe74, Affini-Tech et DatataskJérôme : @jxerome et ZeeneaSponsorsCette publication est sponsorisée par Affini-Tech et CerenIT.CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi sur Time Series France.Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Affini-Tech, La plateforme Datatask pour accélérer vos services Data et IA.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] générique a été composé et réalisé par Maxence Lecointe.
22-9-2022 • 1 uur, 15 minuten, 13 seconden
Episode 147 : Small data and MLops stacks
### Apéro* CVE-2022-38392 -> https://cve.mitre.org/cgi-bin/cvename.cgi?name=CVE-2022-38392* Une chanson de Janet Jackson reconnue officiellement comme un malware -> https://www.01net.com/actualites/une-chanson-de-janet-jackson-reconnue-officiellement-comme-un-malware.html* AI Images: Last Week Tonight with John Oliver (HBO) -> https://youtu.be/3YNku5FKWjw* Demystifying the Parquet File Format | by Michael Berk -> https://towardsdatascience.com/demystifying-the-parquet-file-format-13adb0206705* dbt Constraints: Automatic Primary Keys, Unique Keys, and Foreign Keys for Snowflake -> https://medium.com/snowflake/dbt-constraints-automatic-primary-keys-unique-keys-and-foreign-keys-for-snowflake-d78cbfdec2f9* DBT certification guide -> https://www.getdbt.com/assets/uploads/dbt_certificate_study_guide.pdf?utm_content=216608283&utm_medium=social&utm_source=linkedin&hss_channel=lcp-10893210### Data-science (en production)* Build your open-source MLOps stack -> https://mymlops.com/* Is “Small Data” The Next Big Thing In Data Science? -> https://towardsdatascience.com/is-small-data-the-next-big-thing-in-data-science-9acc7f24907f* A Framework to Understand How Low-Quality Data Hurts Business Performance -> https://towardsdatascience.com/a-framework-to-understand-how-low-quality-data-hurts-business-performance-386c10c4fe1e### Outils* Unix Shells and Terminals -> https://itnext.io/unix-shells-and-terminals-6012fe713e4f
19-9-2022 • 1 uur, 29 minuten, 4 seconden
Episode 146 : Cassandra met tout le monde d'Accord
### Apéro* La reco série TV: WeCrashed sur Apple TV+ -> https://tv.apple.com/fr/show/wecrashed/umc.cmc.6qw605uv2rwbzutk2p2fsgvq9?ctx_brand=tvs.sbd.4000&gclid=Cj0KCQjwlemWBhDUARIsAFp1rLXJzK2SztU23aO4k_R_ZwVSorf5fiXgFTn6SncUQNkDs1A2DK8XHwcaAhgCEALw_wcB&ign-itscg=MC_20000&ign-itsct=atvp_brand_omd&mttn3pid=Google%20AdWords&mttnagencyid=a5e&mttncc=FR&mttnsiteid=143238&mttnsubad=OFR2019932_1-597325122921-c&mttnsubkw=136987586634__l5XJ5eA5_&mttnsubplmnt=* Hitler uses Kubernetes -> https://youtu.be/9wvEwPLcLcA### DataOps* Introducing new Kestra light architecture for open source data orchestration. -> https://kestra.io/blogs/2022-06-21-light-architecture.html### Database* Apache Cassandra 4.1: Building the Database Your Kids Will Use -> https://thenewstack.io/apache-cassandra-4-1-building-the-database-your-kids-will-use/* Distributed Transaction in Database: From EPaxos to Accord -> https://li-boxuan.medium.com/distributed-transaction-in-database-from-epaxos-to-accord-6de7999ad08e* Now in Private Preview: Using On-Premises Data in Place with Snowflake - Snowflake Blog -> https://www.snowflake.com/blog/external-tables-on-prem/### Dev* GitHub Copilot and Open Source: A Love Story That Won't End Well? -> https://thenewstack.io/github-copilot-and-open-source-a-love-story-that-wont-end-well/* Stack Overflow 2022 survey: Most loved and dreaded techs -> https://survey.stackoverflow.co/2022/#section-most-loved-dreaded-and-wanted-other-tools### Data Science / ML / IA* Announcing The Forrester Wave™: AI/ML Platforms, Q3 2022 -> https://www.forrester.com/blogs/announcing-the-forrester-wave-ai-ml-platforms-q3-2022/* Quadrant Q3 2022 -> https://reprints2.forrester.com/#/assets/2/2358/RES176365/report* Automatiser le CLI v2 d’Azure Machine Learning -> https://methodidacte.org/2022/07/automatiser-le-cli-v2-dazure-machine-learning/### Dataviz* Apache Superset is a Data Visualization 2.0 -> https://github.com/apache/superset/tree/master/RELEASING/release-notes-2-0## SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
26-7-2022 • 1 uur, 38 minuten, 16 seconden
Episode 145 : Databricks Data + AI Summit 2022
Retrouver les conférences du summit https://databricks.com/dataaisummit/---------SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
26-7-2022 • 1 uur, 42 minuten, 48 seconden
Episode 144 : DALL-E pour torpiller la productivité
### Apero* Les pires réalisations de DALL-E (2 ou version mini ?) -> https://huggingface.co/spaces/dalle-mini/dalle-mini* HOW DALL-E COULD POWER A CREATIVE REVOLUTION -> https://www.theverge.com/23162454/openai-dall-e-image-generation-tool-creative-revolution### Database* Introducing Unistore, Snowflake’s New Workload for Transactional and Analytical Data -> https://www.snowflake.com/blog/introducing-unistore/* Snowflake summit 2022 -> https://www.montecarlodata.com/snowflake-summit-2022-keynote-recap-disrupting-data-application-development-in-the-cloud/* PostgreSQL et le principe de "Privacy By Design" -> https://blog.dalibo.com/2022/05/23/privacy-by-design.html### ML* Back from MS Build 2022 : Azure ML -> https://www.youtube.com/watch?v=pxY4i76LMSI* Extension VSCode pour DVC et nouvelles features -> https://marketplace.visualstudio.com/items?itemName=Iterative.dvc### Catalog* Lineage de Azure Databricks dans Microsoft Purview -> https://github.com/microsoft/Purview-ADB-Lineage-Solution-Accelerator### Tooling* La prochaine refonte de l'IHM Intellij IDEA -> ### No Code* Coder Moins Coder Mieux -> https://www.programmez.com/magazine/article/low-code-raise-citizen-developer* Développer avec peu ou sans code, mais développer quand même -> https://www.programmez.com/magazine/article/low-code-raise-citizen-developer* Les dix commandements d’une plateforme no-code mature -> https://blog.octo.com/les-dix-commandements-dune-plateforme-no-code-mature/### Culture* The Billion dollar code (la mini série) -> https://www.netflix.com/title/81074012* The Billion dollar code (le making-of, documentaire) -> https://www.netflix.com/title/81503864SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
7-7-2022 • 1 uur, 23 minuten, 30 seconden
Episode 143 : Bases de données DIY ou pas ?
### Apero* La reco série TV: The Dropout sur Disney+ -> https://www.disneyplus.com/fr-fr/series/the-dropout/5C0gjGwyRTeZ* Store files as YouTube videos == infinite disk space -> https://github.com/dzhang314/YouTubeDrive### Database"* AlloyDB for PostgreSQL under the hood -> https://cloud.google.com/blog/products/databases/alloydb-for-postgresql-columnar-engine/https://cloud.google.com/blog/products/databases/alloydb-for-postgresql-intelligent-scalable-storage"* Let's build a distributed Postgres proof of concept -> https://notes.eatonphil.com/distributed-postgres.html* FerretDB/FerretDB: A truly Open Source MongoDB alternative -> https://github.com/FerretDB/FerretDB* Quickwit 0.3: schemaless indexing, aggregations, and more! -> https://quickwit.io/blog/quickwit-0.3//* ZincSearch. A lightweight alternative to elasticsearch -> https://github.com/zinclabs/zinc### ML/AI + Data-Science* Hugging face endpoints in Azure -> https://huggingface.co/blog/hugging-face-endpoints-on-azure* Back from MS Build 2022 -> https://news.microsoft.com/build-2022-book-of-news/fr/* L'IA, c'est pas du Gato -> https://www.deepmind.com/publications/a-generalist-agent### Cloud Native* Apéro: KubeCon EU 2022 -> https://kccnceu2022.sched.com/## SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
7-7-2022 • 1 uur, 21 minuten, 34 seconden
Episode 142 : Le navigateur c'est l'avenir
### Apero* Run Python code in your HTML -> https://pyscript.net/* Comment son micro-ondes intelligent a tenté de le tuer -> https://www.ladn.eu/mondes-creatifs/ia-youtubeur-micro-onde-intelligent-psychopathe/?utm_source=pocket_mylist* I gave my microwave a soul with AI and it tried to kill me -> https://youtu.be/C1G5b_2PYj0### Database* Introducing AlloyDB for PostgreSQL: Free yourself from expensive, legacy databases -> https://cloud.google.com/blog/products/databases/introducing-alloydb-for-postgresql* Snowflake Time Travel and Fail-safe -> https://piariachi.medium.com/snowflake-time-travel-and-fail-safe-4a17e108fc46* Project Tardigrade delivers ETL at Trino speeds to early users -> https://trino.io/blog/2022/05/05/tardigrade-launch.html### ML/AI + Data-Science* What does the future of data engineering look like? -> https://medium.com/artefact-engineering-and-data-science/what-does-the-future-of-data-engineering-look-like-763b4ee91b077* How to Use Hamilton with Pandas in 5 Minutes -> https://towardsdatascience.com/how-to-use-hamilton-with-pandas-in-5-minutes-89f63e5af8f5* Eurybia : Une nouvelle solution #OSSByMAIF pour une Intelligence Artificielle plus maîtrisée -> https://medium.com/oss-by-maif/eurybia-une-nouvelle-solution-ossbymaif-pour-une-intelligence-artificielle-plus-ma%C3%AEtris%C3%A9e-843e651a2ced* Announcing General Availability of Databricks Feature Store -> https://databricks.com/blog/2022/04/29/announcing-general-availability-of-databricks-feature-store.html### Biblio* Next Inpact Le magazine S01E03 -> https://boutique.nextinpact.com/products/magazine-3-de-next-inpact* Blef .fr ( Christophe Blefari datanews) -> https://www.blef.fr/tag/datanews/SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
### L'apéro* Le debrief de Devoxx 2022 -> https://www.devoxx.fr/### Cloud* Announcing General Availability of Change Data Capture (CDC) on Azure SQL Database -> https://techcommunity.microsoft.com/t5/azure-sql-blog/announcing-general-availability-of-change-data-capture-cdc-on/ba-p/3284280* Announcing Gated Public Preview of Unity Catalog on AWS and Azure -> https://databricks.com/blog/2022/04/20/announcing-gated-public-preview-of-unity-catalog-on-aws-and-azure.html### Cloud Native* Enterprises using more Kubernetes across more clouds, but continue to find it challenging: report -> https://devclass.com/2022/04/27/state-of-kubernetes/* Google donates the Istio service mesh to the Cloud Native Computing Foundation -> https://techcrunch.com/2022/04/25/google-donates-the-istio-service-mesh-to-the-cloud-native-computing-foundation/* KubeVirt becomes a CNCF incubating project -> https://www.cncf.io/blog/2022/04/19/kubevirt-becomes-a-cncf-incubating-project/### Machine Learning* Cortex Labs is Joining Databricks to Accelerate Model Serving and MLOps -> https://databricks.com/blog/2022/04/25/cortex-labs-databricks-model-serving-mlops.html* Feathr – An Enterprise-Grade, High Performance Feature Store -> https://github.com/linkedin/feathr### Dev tools* Gitpod x JetBrains join forces to solve 'works on my machine' problem -> https://www.gitpod.io/blog/gitpod-jetbrains### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
15-5-2022 • 1 uur, 13 minuten, 14 seconden
Episode 140 : Feature importance de la mafia dans la data
### Apero* Atlassian a effacé les environnements cloud de 400 clients par erreur -> https://www.usine-digitale.fr/article/atlassian-a-efface-les-environnements-cloud-de-400-clients-par-erreur.N1993357* Hacked News Channel and Deepfake of Zelenskyy Surrendering Is Causing Chaos Online -> https://www-vice-com.cdn.ampproject.org/c/s/www.vice.com/amp/en/article/93bmda/hacked-news-channel-and-deepfake-of-zelenskyy-surrendering-is-causing-chaos-online### Database* PostgreSQL interface -> https://cloud.google.com/spanner/docs/postgresql-interface* Fin de Big Data Cluster en 2025 -> https://docs.microsoft.com/fr-fr/sql/big-data-cluster/release-notes-big-data-cluster?view=sql-server-ver15### ML/AI + Data-Science* Feature importance dans les Random Forests -> https://medium.com/@ali.soleymani.co/stop-using-random-forest-feature-importances-take-this-intuitive-approach-instead-4335205b933f* Neo4J AuraDS GA on GCP -> https://neo4j.com/blog/introducing-graph-data-science-2-0-aurads/### Architecture* Data Mesh From an Engineering Perspective -> https://www.datamesh-architecture.com/#why* Building a Modern Data Stack at Whatnot -> https://medium.com/whatnot-engineering/building-a-modern-data-stack-at-whatnot-afc1d03c3f9* Airbyte acquires Grouparoo to accelerate Data Movement -> https://airbyte.com/blog/airbyte-acquires-grouparoo-to-accelerate-data-movement### Cloud* Modernize your Oracle workloads to PostgreSQL with Database Migration Service, now in preview -> https://cloud.google.com/blog/products/databases/migrate-oracle-to-postgresql* NetApp Announces Intent to Acquire Instaclustr -> https://www.netapp.com/newsroom/press-releases/news-rel-20220407-656381/* BigLake unifies data warehouses and data lakes into a consistent format -> https://cloud.google.com/blog/products/data-analytics/unifying-data-lakes-and-data-warehouses-across-clouds-with-biglake### Cloud Native dev tips* COPY --chmod reduced the size of my container image by 35% -> https://blog.vamc19.dev/posts/dockerfile-copy-chmod/SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
13-5-2022 • 1 uur, 26 minuten, 53 seconden
Episode 139 : Des relations en profondeur de 7 à 77 ans
### Apero* servAtem mise tout sur le 7 ! -> https://www.lemonde.fr/blog/binaire/2022/04/01/servatem-mise-tout-sur-le-7/### Database* Making Real-Time Data Real: Change Data Capture for Astra DB -> https://thenewstack.io/making-real-time-data-real-change-data-capture-for-astra-db/https://github.com/datastax/cdc-apache-cassandra* Unite your data and get a highly scalable, performant, native GraphQL graph database in the cloud that delivers blazingly fast query speeds. -> https://dgraph.io/### ML/AI* Deep Learning Is Hitting a Wall -> https://nautil.us/deep-learning-is-hitting-a-wall-14467/### Data-Science* Validate Your pandas DataFrame with Pandera -> https://towardsdatascience.com/validate-your-pandas-dataframe-with-pandera-2995910e564* 0.9.0: FastAPI Integration, Support GeoPandas DataFrames -> https://github.com/pandera-dev/pandera/releases/tag/v0.9.0### IoT / Time Series* Hexa Data -> https://hexa-ai.fr/annonce-du-produit-hexa-data/* Announcing Grafana Mimir, the most scalable open source TSDB in the world -> https://grafana.com/blog/2022/03/30/announcing-grafana-mimir/### RGPD & co* “Privacy Shield 2.0”? - First Reaction by Max Schrems : -> https://noyb.eu/en/privacy-shield-20-first-reaction-max-schrems* Dataviz DataExploration -> * Like Streamlit, but fast. Enabling low-latency data apps. -> https://medium.com/@ramiromedina/like-streamlit-but-fast-enabling-low-latency-data-apps-948b95b098a2SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi sur [Time Series France](https://www.timeseriesfr.org/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [Datatask](https://datatask.io/)) pour accélérer vos services Data et IAConsulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])Le générique a été composé et réalisé par Maxence Lecointe.
6-5-2022 • 1 uur, 8 minuten, 57 seconden
Episode 138 : Les gentils Cloud, la CNIL et F***DB
### La rubrique de l'indien* CVE-2021-44521 – Exploiting Apache Cassandra User-Defined Functions for Remote Code Execution -> https://jfrog.com/blog/cve-2021-44521-exploiting-apache-cassandra-user-defined-functions-for-remote-code-execution/### Cloud* AWS devriendrait-il gentil? -> https://www.elastic.co/blog/elastic-and-amazon-reach-agreement-on-trademark-infringement-lawsuit* AWS devriendrait-il gentil? -> https://venturebeat.com/2022/03/15/mongodb-and-aws-go-deep-to-help-customers-move-to-the-cloud/### Cloud Native* Kubernetes is complex because you want complex things -> https://home.robusta.dev/blog/kubernetes-is-complex-because-you-want-complex-things/* Programming languages: Go just received its biggest update ever -> https://www.zdnet.com/article/programming-languages-go-just-received-its-biggest-update-ever/* Introducing the Next Generation of K8ssandra! -> https://k8ssandra.io/blog/announcements/release/introducing-the-next-generation-of-k8ssandra/### Machine Learning* Accelerating Edge AI -> https://www.mythic-ai.com/### GDPR for ever* Google Analytics et la CNIL : le décryptage de Converteo -> https://converteo.com/blog/google-analytics-et-la-cnil-le-decryptage-de-converteo/### Search engines & databases* Fugue and DuckDB: Fast SQL Code in Python -> https://towardsdatascience.com/fugue-and-duckdb-fast-sql-code-in-python-e2e2dfc0f8eb* DuckDB with Hannes Muleisen - Software Engineering Daily -> https://softwareengineeringdaily.com/2022/03/18/duckdb-with-hannes-muleisen/* 10 Quick SQL Tips After Writing Daily in SQL for 3 Years -> https://towardsdatascience.com/10-quick-sql-tips-after-writing-daily-in-sql-for-3-years-37bdba0637d0### Tip of the "Week"* Sha256 Algorithm Explained -> https://sha256algorithm.com/### Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://trkit.io/s/BDHSPOAFFINI) et [Datatask](https://trkit.io/s/BDHSPODTSK)* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://trkit.io/s/BDHSPOAFFINI) et [CerenIT](https://trkit.io/s/BDHSPOCERE).[CerenIT](https://trkit.io/s/BDHSPOCERE) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi sur [Time Series France](https://trkit.io/s/BDHSPOTSFR).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! [Affini-Tech](https://trkit.io/s/BDHSPOAFFINI), La plateforme [Datatask](https://trkit.io/s/BDHSPODTSK) pour accélérer vos services Data et IA.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] Le générique a été composé et réalisé par Maxence Lecointe.
29-4-2022 • 1 uur, 1 minuut, 25 seconden
Episode 137 : Cloud native intermittent developer
### Apero* A short history of the O’Reilly animals https://trkit.io/s/BDHEP137JWbM ### La rubrique de l'indien* The Apache Software Foundation Announces Open Source data orchestration platform Apache® Hop™ as a Top-Level Project https://trkit.io/s/BDHEP137wV2V ### Cloud Native* Clever Operator: The best of Kubernetes and Clever Cloud https://trkit.io/s/BDHEP137KKhZ * A Kubernetes Documentary Shares Google’s Open Source Story https://trkit.io/s/BDHEP137Wa5e ### Data-Gouv* open-metadata Open Standard for Metadata https://trkit.io/s/BDHEP137gMn0 ### Search engines & databases* Quickwit takes on Elasticsearch with an open source search engine for large datasets https://trkit.io/s/BDHEP137pFsi * Quickwit 0.2 brings full-text search to ClickHouse and Kafka! https://trkit.io/s/BDHEP1377ivq * Quickwit https://trkit.io/s/BDHEP137JcI3 ### Tip of the "Week"* Optimisez les ressources systèmes avec ulimit – Buzut https://trkit.io/s/BDHEP137t76r ### Orateurs* Vincent : @vhe74 https://twitter.com/vhe74 , Affini-Tech https://trkit.io/s/BDHSPOAFFINI et Datatask https://trkit.io/s/BDHSPODTSK * Jérôme : @jxerome https://twitter.com/jxerome et Zeenea https://www.zeenea.com * Alexander : @alexanderdeja https://twitter.com/alexanderDeja ### SponsorsCette publication est sponsorisée par Affini-Tech https://trkit.io/s/BDHSPOAFFINI et CerenIT https://trkit.io/s/BDHSPOCERE .CerenIT https://trkit.io/s/BDHSPOCERE vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi sur Time Series France https://trkit.io/s/BDHSPOTSFR .Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Affini-Tech https://trkit.io/s/BDHSPOAFFINI , La plateforme Datatask https://trkit.io/s/BDHSPODTSK pour accélérer vos services Data et IA.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] Le générique a été composé et réalisé par Maxence Lecointe.
25-3-2022 • 52 minuten, 49 seconden
Episode 136 : Il y a t'il un copilot devant le clavier ?
------Apéro The Apache Software Foundation Bloghttps://trkit.io/s/BDHEP136wxdwAWS owns $2.5 billion of IPv4 addresseshttps://trkit.io/s/BDHEP136eiDPComment utiliser IPv6 dans le cloud/AWS ?https://trkit.io/s/BDHEP1360tpQ------Tools7 Promising VS Code Extensions Introduced in 2021https://trkit.io/s/BDHEP136bCXQREST Client — Extension VSCode https://trkit.io/s/BDHEP136vcuQIntelligence artificielle : L’assistant GitHub Copilot réduit d’un tiers le travail des développeurshttps://trkit.io/s/BDHEP1369afo------Machine LearningFive tricks you should know about Azure Machine Learning Servicehttps://trkit.io/s/BDHEP136sD2fL'effet de la mise à l'échelle des images sur les performances des algorithmeshttps://trkit.io/s/BDHEP136fILBCours en ligne Apprentissage Profond par Yann Le Cun & Alfredo Canzianihttps://trkit.io/s/BDHEP136UXGYPyCaret 2.3.6https://trkit.io/s/BDHEP136Hvre------Cloud NativeThe State of Cloud Native Developmenthttps://trkit.io/s/BDHEP136QAAl------------SponsorsCette publication est sponsorisée par Affini-Tech (https://trkit.io/s/BDHSPOAFFINI) et CerenIT (https://trkit.io/s/BDHSPOCERE).CerenIT (https://trkit.io/s/BDHSPOCERE) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi sur Time Series France (https:/trkit.io/s/BDHSPOTSFR).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! [Affini-Tech (https://trkit.io/s/BDHSPOAFFINI), La plateforme Datatask (https://trkit.io/s/BDHSPODTSK)) pour accélérer vos services Data et IAOn recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected] Le générique a été composé et réalisé par Maxence Lecointe.
21-3-2022 • 1 uur, 33 minuten, 53 seconden
Episode 135 : La Data dans Kubernetes avec Jérôme Petazzoni
Un épisode thématique enregistré le 07/01/2022 avec Jérome Petazzoni et Julien Laurenceau. Nous faisons le point sur la gestion de la data dans Kubernetes.Shownotes complètes sur : https://trkit.io/s/BDHEP135
22-2-2022 • 2 uur, 3 minuten, 46 seconden
Episode 134 : Merry X-Mas les coquinous !
Episode 134 : Merry X-Mas les coquinous !Un épisode de fin d'année et de news enregistré le 22/12/2021.avec Vincent Heuschling, Jérôme Mainaud, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP134
23-12-2021 • 1 uur, 13 minuten, 20 seconden
Episode 133 : IaaS qu'il faut et plus encore en serverless
Episode 133 : IaaS qu'il faut et plus encore en serverlessUn épisode de news enregistré le 10/12/2021.avec Alexander Dejanovski, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP133
17-12-2021 • 1 uur, 22 minuten, 44 seconden
Episode 132 : Le No-Code est-il compatible avec le RegistryOps ?
Episode 132 : Le No-Code est-il compatible avec le RegistryOps ?Un épisode de news enregistré le 26/11/2021.avec Vincent Heuschling, Jérôme Mainaud, Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP132
10-12-2021 • 1 uur, 25 minuten, 6 seconden
Episode 131 : big data à 230 kb/s
Episode 131 : big data à 230 kb/sPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 12/11/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP131
3-12-2021 • 1 uur, 47 minuten, 47 seconden
Episode 130 : Du DevSecOps administrativement souverain
Episode 130 : Du DevSecOps administrativement souverainPar Vincent Heuschling, Jérome Mainaud, Nicolas Steinmetz, et Alexander DejanovskiUn épisode de news enregistré le 15/10/2021.Shownotes complètes sur : https://trkit.io/s/BDHEP130
22-11-2021 • 1 uur, 56 minuten, 27 seconden
Episode 129 : Tant qu'il IA du SQL
Un épisode de news enregistré le 01/10/21 par Vincent Heuschling, Jérôme Mainaud, et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP129
31-10-2021 • 1 uur, 24 minuten, 45 seconden
Episode 128 : Infinidash 4.0
Un épisode de news enregistré le 17/09/21 par Vincent Heuschling, Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP128
24-9-2021 • 1 uur, 26 minuten, 23 seconden
Episode 127 : Pour quelques dollars de plus...
Un épisode de News enregistré le 10 sept 2021 On y parle de Docker, de Serverless, de grosses poignées de dollars, de bases de données, et de processeurs. Shownotes complètes sur : https://trkit.io/s/BDHEP127
20-9-2021 • 1 uur, 22 minuten, 23 seconden
Episode 126 : Indexima, SQL, ML & optimisation
Un épisode thématique enregistré le 16/07/2021. Nous recevons Nicolas Korchia pour nous parler d'Indexima. Indexima optimise les requêtes SQL entre les outils de Dataviz ou de BI et les Cloud data warehouses. Shownotes complètes sur : https://trkit.io/s/BDHEP126
25-7-2021 • 1 uur, 27 minuten, 34 seconden
Episode 125 : Azure avec Julien Dubois
Un épisode thématique enregistré le 02/07/2021. Nous recevons Julien Dubois, Java Developer Advocacy manager chez Microsoft.Shownotes complètes sur : https://trkit.io/s/BDHEP125
14-7-2021 • 2 uur, 8 minuten, 27 seconden
Episode 124 : Ultra bleu ou vert, c'est selon
Un épisode de news enregistré le 18/06/21 par Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP124
2-7-2021 • 1 uur, 42 minuten, 54 seconden
Episode 123 : Data+AI Summit avec Quentin Ambard
Data+AI Summit avec Quentin Ambard de DatabricksEnregistré le 4/6/2021 par Quentin Ambard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP123
23-6-2021 • 1 uur, 8 minuten, 27 seconden
Episode 122 : Le défi de la data dans le monde de la voile
Le défi de la data dans le monde de la voileEnregistré le 26/03/2021 par Olivier Douillard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP122
11-6-2021 • 1 uur, 23 minuten, 17 seconden
Episode 121 : Le défi de la data chez les experts comptables
Le défi de la data chez les experts comptablesEnregistré le12/03/2021 par Fabrice Heuvrard, Vincent Heuschling, Nicolas Steinmetz, et Jérôme MainaudShownotes complètes sur : https://trkit.io/s/BDHEP121
31-5-2021 • 1 uur, 16 minuten, 12 seconden
Episode 120 : 50 ans de FTP et toujours pas à la retraite
50 ans de FTP et toujours pas à la retraiteEnregistré le 07/05/2021 par Vincent Heuschling, Nicolas Steinmetz, et Jérôme MainaudShownotes complètes sur : https://trkit.io/s/BDHEP120
16-5-2021 • 1 uur, 55 minuten, 27 seconden
Episode 119 - Le Cloud Native Developper fait-il autre chose que du Kubernetes ?
Cloud Native Developper !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérôme Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP119
16-4-2021 • 1 uur, 45 minuten, 48 seconden
Episode 118 : Excel, à fond la fonction
Excel, à fond la fonction !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP118
18-2-2021 • 1 uur, 55 minuten, 57 seconden
Episode 117 : AWS avec Sébastien Stormacq
L'offre AWS avec les annonces "data" de Re-Invent 2020 par Sébastien StormacqEnregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP117
7-2-2021 • 1 uur, 51 minuten, 9 seconden
Episode 116 : Powerpoint la bdd du futur
Powerpoint la base de données du futur !Enregistré le 15/01/2021 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP116
19-1-2021 • 1 uur, 44 minuten, 9 seconden
Episode 115 : CentOS est mort, vive CentOS
CentOS est mort, vive CentOS !Enregistré le 18/12/2020 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaudet Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP115
15-1-2021 • 1 uur, 36 minuten, 25 seconden
Episode 114 : Bientôt un abonnement pour écouter BigData Hebdo ?
Bientôt un abonnement pour écouter BigData Hebdo ?Episode de News enregistré le 4/12/2020 par Nicolas Steinmetz, Jérôme Mainaud, Alexander Dejanovski, et Vincent Heuschling Shownotes complètes sur : https://trkit.io/s/BDHEP114
31-12-2020 • 1 uur, 46 minuten
Episode 113 : Data Catalog et Data Discovery
Un épisode thématique sur le data catalog, la data discovery et la gouvernance des données, enregistré le 20/11/20 par Vincent Heuschling, Nicolas Steinmetz, Jérome Mainaud, Sandrine Bernaud de Zeenea, et Sylvain L.Shownotes complètes sur : https://trkit.io/s/BDHEP113
27-12-2020 • 1 uur, 35 minuten, 21 seconden
Episode 112 : Dans le radar des cool vendors
Dans le radar des cool vendorsEpisode de News enregistré le 06/11/2020 par Nicolas Steinmetz et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP112
2-12-2020 • 1 uur, 20 minuten, 56 seconden
Episode 111 : L'AI à 60 dollars
L'AI à 60 dollarsEpisode de News enregistré le 23/10/2020 par Alexander Dejanovski, Jérôme Mainaud, et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP111
28-11-2020 • 1 uur, 39 minuten, 11 seconden
Episode 110 : Du SQL à toutes les sauces
Du SQL à toutes les saucesEpisode de News enregistré le 9/10/2020 par Nicolas Steinmetz, Jérôme Mainaud, et Vincent HeuschlingShownotes complètes sur : https://trkit.io/s/BDHEP110
12-10-2020 • 1 uur, 39 minuten, 11 seconden
Episode 109 : Un bras ça coute cher ...
Un bras ça coute cher, mais pas autant qu'un flocon....Episode de News enregistré le 25/9/2020 par Nicolas Steinmetz, Jérôme Mainaud, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP109
11-10-2020 • 1 uur, 39 minuten, 11 seconden
Episode 108 : Azure Synapse
Azure synapse AnalyticsEnregistré le 11 septembre 2020 avec Fabien Adato et Paul Peton , Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP10!
13-9-2020 • 1 uur, 39 minuten, 11 seconden
Episode 107 : 100 millions sinon rien
Quelques news de rentréeEnregistré le septembre 2020 avec Alexander Dejanovski, Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP107a
7-9-2020 • 1 uur, 36 minuten, 33 seconden
Episode 106 : Hadoop et Cloudera, hier, aujourd'hui et demain
Quelques news pour l'étéEnregistré le 24 Juillet 2020 avec Denis Fraval, Laurent Edel, Vincent Heuschling , Jérôme Mainaud ,et Nicolas SteinmetzShownotes complètes sur : https://trkit.io/s/BDHEP106
18-8-2020 • 1 uur, 36 minuten, 33 seconden
Episode 105 : summer news
Quelques news pour l'étéEnregistré le 10 Juillet 2020 par Vincent Heuschling , Jérôme Mainaud, Nicolas Steinmetz, et Alexander DejanovskiShownotes complètes sur : https://trkit.io/s/BDHEP105
14-8-2020 • 1 uur, 18 minuten, 12 seconden
Episode 104 : Spark 3
Une interview sur Apache Spark 3 enregistrée le 26 juin 2020Shownotes complètes sur : https://trkit.io/s/BDHEP104
10-8-2020 • 1 uur, 9 minuten, 9 seconden
Episode 103 : Consul
Une interview sur Consul enregistrée le 12 juin 2020Shownotes complètes sur : https://trkit.io/s/BDHEP103aAffini-Tech sera présent le 14 et 15 septembre 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Pierre Souchay : [@vizionr](https://twitter.com/vizionr)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi au [Paris Time Series Meetup](https://www.ptsm.io/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), La plateforme [DataTask](https://datatask.io/)) accélère vos projets Data et IA.Consulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])
15-7-2020 • 1 uur, 15 minuten, 40 seconden
Episode 102 : La data dans l'entreprise 4.0
Shownotes détaillées : https://trkit.io/s/BDHEP102La data dans l'entreprise 4.0, ou comment la data révolutionne l'industrie.Décriptage d'un mouvement de fond avec Laurent Laporte de Braincube.Pour suivre Laurent Laporte : https://www.linkedin.com/in/laurentlaporte/et Braincube : https://www.linkedin.com/company/braincubefr/ou https://braincube.com/Affini-Tech sera présent le 27 et 28 mai 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Vincent : [@vhe74](https://twitter.com/vhe74)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi au [Paris Time Series Meetup](https://www.ptsm.io/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), [Datatask](https://datatask.io/))Consulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])
2-7-2020 • 56 minuten, 23 seconden
Episode 101 : soit 5 en binaire
Shownotes complètes sur : https://trkit.io/s/BDHEP101 Affini-Tech sera présent le 14 et 15 septembre 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi au [Paris Time Series Meetup](https://www.ptsm.io/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), [Datatask](https://datatask.io/))Consulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])
21-6-2020 • 1 uur, 19 minuten, 52 seconden
Episode 100 : Anniversaire avec la communauté
Shownotes complètes sur : https://trkit.io/s/BDHEP100 Affini-Tech sera présent le 27 et 28 mai 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi au [Paris Time Series Meetup](https://www.ptsm.io/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), [Datatask](https://datatask.io/))Consulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])
4-6-2020 • 3 uur, 9 minuten, 46 seconden
Episode 99 : Apache Pulsar et Kafka on Pulsar
On parle de Apache Pulsar et Kafka on Pulsar avec nos invitésShownotes complètes sur : https://trkit.io/s/BDHEP99Steven : https://twitter.com/GwinizDuPierre : https://twitter.com/PierreZQuentin : https://twitter.com/waxzceVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et CerenitBesoin de concevoir, d'industrialiser ou d'automatiser vos plateformes ? Ecrivez nous à [email protected]( https://www.cerenit.fr/ et https://twitter.com/_CerenIT )Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com----------------------------------------------------------------
6-5-2020 • 1 uur, 19 minuten, 58 seconden
Episode 98 : Datastax, le retour à la communauté ?
Shownotes complètes sur : https://trkit.io/s/BDHEP98Cedrick Lunven et Alexander Dejanovski nous parlent du rachat de the last pickle par Datastax* The Last Pickle Joining DataStax https://trkit.io/s/BDH-HecICs* Des Workshop online tous les mercredis (celui la jeudi)https://trkit.io/s/BDHBFNBJeCA* Posez vos questions à la communautéhttps://trkit.io/s/BDHdqLRTZpH* FF4J le projet OSS de Cedrick https://trkit.io/s/BDHUImVCBxr### Meetups et conférences Bigdatapero en stand by et probablement en remote Bigdata Paris 27 et 28 Mai Affini-Tech sera présent le 27 et 28 mai 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/ ### Orateurs* Jérôme : [@jxerome](https://twitter.com/jxerome) et [Zeenea](https://www.zeenea.com)* Nicolas: [@nsteinmetz](https://twitter.com/nsteinmetz), [CerenIT](https://www.cerenit.fr/), [Paris Time Series Meeup](https://www.ptsm.io/)* Vincent : [@vhe74](https://twitter.com/vhe74)* Alexander : [@alexanderdeja](https://twitter.com/alexanderDeja)* Cedrick Lunven : [@clunven](https://twitter.com/clunven)### SponsorsCette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/).[CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [[email protected]](mailto:[email protected]) et retrouvez-nous aussi au [Paris Time Series Meetup](https://www.ptsm.io/).Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter etExecuter vos services ! ([Affini-Tech](http://affini-tech.com), [Datatask](https://datatask.io/))Consulter le [blog d'Affini-Tech](https://affini-tech.com/blog/) et le [blog de Datatask](https://datatask.io/blog/) pour en savoir plus.On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [[email protected]](mailto:[email protected])
6-4-2020 • 1 uur, 19 minuten, 9 seconden
Episode 97 : Aller sur Mars est plus facile que calculer sa facture AWS
-------------------------------------------------------------TimeseriesLes propriétés d'une TSDBhttps://bigdatahebdo.slack.com/archives/CKY2CM1PZ/p1583925694020400Les propriétés d'une TSDBhttps://bigdatahebdo.slack.com/archives/CKY2CM1PZ/p1583870681011800RedisTimeSeries 1.2https://redislabs.com/blog/redistimeseries-version-1-2-is-here/InfluxDB 2.0 b6https://www.influxdata.com/blog/release-announcement-influxdb-2-0-0-beta-6/Warp10 dépasse les 1000 fonctionshttps://warp10.io/doc/functionListZeenea Calalogue InfluxDB (les TS et la listes de métriques)https://zeenea.com/fr/accueil/-------------------------------------------------------------DatabaseBigQuery Best Practiceshttps://medium.com/google-cloud/bigquery-best-practices-9452c294c9d9FaunaDB's Official Jepsen Resultshttps://fauna.com/blog/faunadbs-official-jepsen-results-------------------------------------------------------------CloudNASA to launch 247 petabytes of data into AWS – but forgot about eye-watering cloudy egress costs before lift-offhttps://www.theregister.co.uk/2020/03/19/nasa_cloud_data_migration_mess/-------------------------------------------------------------DatascienceData Clustering Tutorial for Advancedhttps://towardsdatascience.com/clustering-for-data-nerds-ebbfb7ed4090ML based Network Anomaly Detection solution to identify Cyber Security Threathttps://github.com/GoogleCloudPlatform/df-ml-anomaly-detection-------------------------------------------------------------Meetups et conférencesPTSM.io - site is live (à défaut de meetups)https://www.ptsm.io/Bigdatapero Live -------------------------------------------------------------Affini-Tech sera présent le 27 et 28 mai 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/-------------------------------------------------------------Lisez le blog d'Affini-Tech et de Datataskhttps://affini-tech.com/blog/https://datatask.io/blog/-------------------------------------------------------------Lisez le blog de Cerenithttps://www.cerenit.fr/blog/-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.com
24-3-2020 • 1 uur, 11 minuten, 29 seconden
Episode 96 : Le dernier cornichon s'est fait croquer
The Last Pickle Joining DataStaxhttp://thelastpickle.com/blog/2020/03/04/tlp-joining-datastax.htmlGoogle rise K8S pricehttps://cloud.google.com/kubernetes-engine/pricingLes Revenus d'elastic vs AWShttps://twitter.com/pauldix/status/1233093948425588737https://twitter.com/mjasay/status/1233082891585904642Elastic sur clever cloudhttps://www.clever-cloud.com/blog/features/2020/03/05/elastic-stack/?pk_campaign=elastic-stack-platinium&pk_kwd=twitterHow Netflix uses Druid for Real-time Insights to Ensure a High-Quality Experiencehttps://netflixtechblog.com/how-netflix-uses-druid-for-real-time-insights-to-ensure-a-high-quality-experience-19e1e8568d06Comparison of the Open Source OLAP Systems for Big Data: ClickHouse, Druid, and Pinothttps://medium.com/@leventov/comparison-of-the-open-source-olap-systems-for-big-data-clickhouse-druid-and-pinot-8e042a5ed1c7Mon DRH est une IAhttps://www.latribune.fr/opinions/tribunes/mon-drh-est-une-ia-840027.htmlLe pylone qui valait 5 millions de dollarshttps://www.franceinter.fr/emissions/le-code-a-change/le-pylone-qui-valait-5-millions-de-dollarsElon Musk veut connecter votre cerveau à un ordinateurhttps://podcast.ausha.co/anti-brouillard-1/flash-elon-musk-veut-connecter-votre-cerveau-a-un-ordinateur-------------------------------------------------------------Meetups et conférencesMeetup grafanahttps://www.meetup.com/fr-FR/Grafana-friends-Paris-democratize-observability/Bigdatapero 18/3 en stand by PTSM 3REPORTE : Date à définir chez OVH sur RedisTimeSeries & TSL - en fonction du coronavirusPTSM 5 fin avril, Elastic Stack & TS + 2nd talk à définir + Lieu à définirBigdata Paris27 et 28 Mai-------------------------------------------------------------Affini-Tech sera présent le 27 et 28 mai 2020 avec Datatask au Big Data Paris sur le stand D22 "Datatask by Affini-Tech" https://www.bigdataparis.com/2020/-------------------------------------------------------------Lisez le blog d'Affini-Tech et de Datataskhttps://affini-tech.com/blog/https://datatask.io/blog/-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.com
7-3-2020 • 1 uur, 12 minuten, 54 seconden
Episode 95 : Le futur de la data avec Paul Peton
Un episode sur la base d'articles écrits par Paul Peton : "De quoi le futur de la data sera-t-il fait ? (sous un intervalle de prévision assez large…)”https://link.medium.com/JJ9afimvw4“Choisir un environnement technique pour la Data Science” https://link.medium.com/0Dv7uSsvw4L'instant confiture : les réseaux de neuronesLOVELY ANALYTICS - Réseaux de neurones comment ça marche ?https://lovelyanalytics.com/2017/06/14/reseaux-de-neurones-comment-ca-marche/Une vidéo de Youen de Saagie allant jusqu’au Deep Learning : https://www.youtube.com/watch?v=6XqhY29uzlMEt pour se détendre (ne pas se laisser démotiver par le style :-)🎭 On nous fake profond - DEFAKATOR (explication sur les réseaux de neurones à 26:50)https://www.youtube.com/watch?v=AT89_nM0nes&t=1684s-------------------------------------------------------------Retrouvez Paul Peton sur son Blog http://methodidacte.org/ et sur son Twitter https://twitter.com/paulpeton-------------------------------------------------------------Affini-Tech sera présent avec Datatask au Big Data Paris 2020 sur le stand D22 "Datatask by Affini-Tech"https://www.bigdataparis.com/2020/-------------------------------------------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoPaul Peton : https://twitter.com/paulpetonVincent : https://twitter.com/vhe74Jérôme : https://twitter.com/jxerome et https://www.zeenea.com-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et CerenitBesoin de concevoir, d'industrialiser ou d'automatiser vos plateformes ? Ecrivez nous à [email protected]( https://www.cerenit.fr/ et https://twitter.com/_CerenIT )Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com----------------------------------------------------------------
2-3-2020 • 1 uur, 35 minuten, 30 seconden
Episode 94 : Data Lake House
THE DATA LAKEHOUSE ?https://www.moderndataanalytics.com/post/the-data-lakehouseWhat Is a Data Lakehouse?https://databricks.com/blog/2020/01/30/what-is-a-data-lakehouse.htmlDBLog: A Generic Change-Data-Capture Frameworkhttps://medium.com/netflix-techblog/dblog-a-generic-change-data-capture-framework-69351fb9099bMySQL is the DBMS of the Year 2019https://db-engines.com/en/blog_post/83Keystone Real-time Stream Processing Platformhttps://netflixtechblog.com/keystone-real-time-stream-processing-platform-a3ee651812aInternals of Google Cloud Spannerhttps://thedataguy.in/internals-of-google-cloud-spanner/La CNIL publie un guide RGPD pour les développeurshttps://www.cnil.fr/fr/la-cnil-publie-un-guide-rgpd-pour-les-developpeursGoogle Datasearchhttps://towardsdatascience.com/google-just-published-25-million-free-datasets-d83940e24284https://datasetsearch.research.google.com/`-------------------------------------------------------------Affini-Tech sera présent avec Datatask au Big Data Paris 2020 sur le stand D22 "Datatask by Affini-Tech"https://www.bigdataparis.com/2020/-------------------------------------------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.com-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et CerenitBesoin de concevoir, d'industrialiser ou d'automatiser vos plateformes ? Ecrivez nous à [email protected]( https://www.cerenit.fr/ et https://twitter.com/_CerenIT )Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com----------------------------------------------------------------
26-2-2020 • 1 uur, 53 seconden
Episode 93 : Foundation DB
Foundation DBhttps://github.com/apple/foundationdb/wiki/FoundationDB-Release-7.0-Planninghttps://pierrezemb.fr/posts/notes-about-foundationdb-------------------------------------------------------------DevFest du Bout du Monde 2020The DevFest, or 'Developers Festival', is a technical conferences for software developers. It is aimed to students, profesionals or simply curious technophile.https://devfest.duboutdumonde.bzh/-------------------------------------------------------------OvhCloud / Datahttps://www.ovhcloud.com/fr/public-cloud/data-analytics/-------------------------------------------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdo-------------------------------------------------------------Steven : https://twitter.com/GwinizDuPierre : https://twitter.com/PierreZVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz -------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et CerenitBesoin de concevoir, d'industrialiser ou d'automatiser vos plateformes ? Ecrivez nous à [email protected]( https://www.cerenit.fr/ et https://twitter.com/_CerenIT )Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com----------------------------------------------------------------
17-2-2020 • 1 uur, 45 minuten, 15 seconden
Episode 92 : T'as lu le Codd ?
Better Drivers for Cassandrahttps://www.datastax.com/blog/2020/01/better-drivers-for-cassandraInfluxDB 2.0 beta 1https://www.influxdata.com/blog/influxdb-2-0-open-source-beta-released/InfluxDB 2.0 beta 2https://www.influxdata.com/blog/release-announcement-influxdb-2-0-0-beta-2/When to Say No to Machine Learninghttps://medium.com/semi-random-thoughts/a-product-managers-guide-to-when-to-say-no-to-machine-learning-and-when-to-say-yes-1cd6d7884c7Using Prophet To Forecast Weather Data and Detect Anomalieshttps://towardsdatascience.com/using-prophet-to-forecast-weather-data-8e4fc6b8f8e5Kalman Filters for Software Engineershttps://towardsdatascience.com/kalman-filters-for-software-engineers-3d2a05dee465Pas mal de nouveautés dans bigqueryhttps://cloud.google.com/blog/products/data-analytics/whats-happening-in-bigquery-jan2020OVHcloud Object Storage clusters support S3 APIhttps://www.ovh.com/blog/ovhcloud-object-storage-clusters-support-s3-api/L'instant confiture"A Relational Model of Data forLarge Shared Data Banks"https://www.seas.upenn.edu/~zives/03f/cis550/codd.pdf-----------------------------Pour rejoindre le Slack c'est ici : http://trkit.io/s/invitebdh-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.com-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et CerenitBesoin de concevoir, d'industrialiser ou d'automatiser vos plateformes ? Ecrivez nous à [email protected]( https://www.cerenit.fr/ et https://twitter.com/_CerenIT )Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com----------------------------------------------------------------
2-2-2020 • 1 uur, 24 minuten, 16 seconden
Episode 91 : C'est en rachetant qu'on devient un géant
-----------------------------Quelques newsGoogle May Buy Salesforce To Help Bolster Its Cloud Businesshttps://www.webpronews.com/google-may-buy-salesforce/The Apache Software Foundation Bloghttps://blogs.apache.org/foundation/entry/the-apache-news-round-up151 - Apache Libcloud 2.7.0 released http://libcloud.apache.org/ - Apache Libcloud 2.8.0 released https://libcloud.apache.org/ - Apache TVM (Incubating) 0.6.0 released https://tvm.apache.org/ - Apache Druid (incubating) 0.16.1 released http://druid.apache.org/ - Apache HBase 2.1.8 released http://hbase.apache.org/ - Apache Kafka 2.4.0 released http://kafka.apache.org/ - Apache Hivemall (Incubating) 0.6.0 released http://hivemall.incubator.apache.org/ - Apache Kylin 3.0.0 released http://kylin.apache.org - Apache Geode 1.11.0 released https://geode.apache.org/ - Apache Drill 1.17.0 released https://drill.apache.org/ - Apache® SINGA™ as a Top-Level Project http://singa.apache.org/Apache in 2019 by the numbershttps://blogs.apache.org/foundation/entry/apache-in-2019-by-the-----------------------------Suite de la FAQ de NOEL (Décembre 2019)Dans cet épisode on rcontinue de répondre aux questions de nos auditeurs présents dans le Slack.Pour rejoindre le Slack c'est ici : http://trkit.io/s/invitebdh-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comAlexander : https://twitter.com/alexanderDeja-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et CerenitBesoin de concevoir, d'industrialiser ou d'automatiser vos plateformes ? Ecrivez nous à [email protected]( https://www.cerenit.fr/ et https://twitter.com/_CerenIT )Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com----------------------------------------------------------------
14-1-2020 • 1 uur, 27 minuten, 37 seconden
Episode 90 : La FAQ de NOEL 2019
LA FAQ de NOEL (Décembre 2019)Dans cet épisode on répond aux questions de nos auditeurs présents dans le Slack.Pour rejoindre le Slack c'est ici : http://trkit.io/s/invitebdh-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comAlexander : https://twitter.com/alexanderDeja-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et CerenitBesoin de concevoir, d'industrialiser ou d'automatiser vos plateformes ? Ecrivez nous à [email protected]( https://www.cerenit.fr/ et https://twitter.com/_CerenIT )Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com----------------------------------------------------------------
23-12-2019 • 1 uur, 20 minuten, 54 seconden
Episode 89 : Si AWS ne fait pas un service managé avec ton produit tu n'existes pas
Episode 89 : Si AWS ne fait pas un service managé avec ton produit, tu n'existes pasLa FAQ de Noël pour l'épisode 90 : https://trkit.io/s/BDHFAQNOEL----------------------------------------------------------------Cocorico ou presqueDataiku : Florent Douetteau [Podcast / Itw]https://pca.st/vdt5xiutAvec Dataiku, la France se dote d’une nouvelle « licorne »https://www.lemonde.fr/economie/article/2019/12/04/avec-dataiku-la-france-se-dote-d-une-nouvelle-licorne_6021687_3234.html----------------------------------------------------------------TimeseriesTime Series Prediction - A short introduction for pragmatistshttps://www.liip.ch/en/blog/time-series-prediction-a-short-comparison-of-best-practicesUsing Gradient Boosting for Time Series prediction taskshttps://towardsdatascience.com/using-gradient-boosting-for-time-series-prediction-tasks-600fac66a5fcTime series features extraction using Fourier and Wavelet transforms on ECG datahttps://blog.octo.com/time-series-features-extraction-using-fourier-and-wavelet-transforms-on-ecg-data/----------------------------------------------------------------NoSQLCassandra chez AWShttps://aws.amazon.com/fr/mcs/https://aws.amazon.com/fr/blogs/aws/new-amazon-managed-apache-cassandra-service-mcs/https://www.scylladb.com/2019/12/04/managed-cassandra-on-aws-our-take/----------------------------------------------------------------SQL for everModern Data Practice and the SQL Traditionhttps://tselai.com/modern-data-practice-and-the-sql-tradition.htmlAdvent of code with Google Bigqueryhttps://towardsdatascience.com/advent-of-code-sql-bigquery-31e6a04964d4https://adventofcode.comhttps://www.reddit.com/r/adventofcode/----------------------------------------------------------------IAReconnaissance de symbole avec IAProgrammez! n°235 décembre 2019Practical AI https://practicalai.me/Googler Zack Akil to discuss machine learning and AI advances at Googlehttps://www.gcppodcast.com/post/episode-206-ml-ai-with-zack-akil/Dev board TPUhttps://coral.ai/products/dev-board/----------------------------------------------------------------Outils en tout genreMaking Git and Jupyter Notebooks play nicehttp://timstaley.co.uk/posts/making-git-and-jupyter-notebooks-play-nice/IntelliJ IDEA 2019.3: Better Performance and Qualityhttps://blog.jetbrains.com/idea/2019/11/intellij-idea-2019-3-better-performance-and-quality/----------------------------------------------------------------AnnoncesBigdatapero en janvier à définir17/12/2019PTSM #3 RedisTimeSeries & TSLhttps://www.meetup.com/fr-FR/Paris-Time-Series-Meetup/events/266610627/----------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttp://trkit.io/s/invitebdh----------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comVincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et CerenitBesoin de concevoir, d'industrialiser ou d'automatiser vos plateformes ? Ecrivez nous à [email protected]( https://www.cerenit.fr/ et https://twitter.com/_CerenIT )Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com----------------------------------------------------------------
10-12-2019 • 1 uur, 6 minuten, 45 seconden
Episode 88 : DB ou pas DB ?
Episode 88 La FAQ de Noël pour l'épisode 89 : https://trkit.io/s/BDHFAQNOELCloud & OpsThe $10m engineering problemhttps://segment.com/blog/the-10m-engineering-problem/Dockerhttps://techcrunch.com/2019/11/13/mirantis-acquires-docker-enterprise/https://www.docker.com/press-release/docker-new-directionhttps://www.docker.com/blog/docker-next-chapter-advancing-developer-workflows-for-modern-apps/https://thenewstack.io/mirantis-acquires-docker-enterprise/DatabaseMedusa - Spotify’s Apache Cassandra backup tool is now open sourcehttp://thelastpickle.com/blog/2019/11/05/cassandra-medusa-backup-tool-is-open-source.htmlDatastax : Announcing Our New CEOhttps://www.datastax.com/blog/2019/10/announcing-our-new-ceoArticle: How to Use Redis TimeSeries with Grafana for Real-time Analyticshttps://www.infoq.com/articles/redis-time-series-grafana-real-time-analyticsArticle: How to Use Redis TimeSeries with Grafana for Real-time Analytics en FRhttps://www.infoq.com/fr/articles/redis-time-series-grafana-real-time-analytics/New DB Category : predictive dbhttps://aito.ai/blog/introducing-a-new-database-category-the-predictive-database/KafkaKSQLDBhttps://www.confluent.io/blog/intro-to-ksqldb-sql-database-streamingHadoopData Quality @ Criteohttps://medium.com/criteo-labs/big-data-quality-at-criteo-66c6bd0d42d8DiversHuman speech may have a universal transmission rate: 39 bits per secondhttps://www.sciencemag.org/news/2019/09/human-speech-may-have-universal-transmission-rate-39-bits-secondDifferent languages, similar encoding efficiency: Comparable information rates across the human communicative nichehttps://advances.sciencemag.org/content/5/9/eaaw2594snipshttps://www.lesechos.fr/tech-medias/hightech/sonos-rachete-lassistant-vocal-francais-snips-pour-37-milliards-de-dollars-1149589RDV17/12/2019PTSM #3 RedisTimeSeries & TSLhttps://www.meetup.com/fr-FR/Paris-Time-Series-Meetup/events/266610627/23 January 2020ElasticOn Tour Parishttps://www.elastic.co/elasticon/tour/paris----------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttp://trkit.io/s/invitebdh----------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comVincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et CerenitBesoin de concevoir, d'industrialiser ou d'automatiser vos plateformes ? Ecrivez nous à [email protected]( https://www.cerenit.fr/ et https://twitter.com/_CerenIT )Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com----------------------------------------------------------------
28-11-2019 • 1 uur, 23 minuten, 27 seconden
Episode 87 : Un elephant peut en cacher un autre
Episode 87 pgday Paris 2020https://2020.pgday.paris/----------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttp://bit.ly/Invitebdh----------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoAdrien : https://twitter.com/Adrien_nayratNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comVincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et Cerenit( http://affini-tech.com https://twitter.com/affinitech )( https://www.cerenit.fr/ et https://twitter.com/_CerenIT )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com----------------------------------------------------------------
13-11-2019 • 1 uur, 19 minuten, 52 seconden
Episode 86 : des news et des meetups qui pulsent
Episode 86 : Des news et des meetups qui pulsent----------------------------------------------------------------De retour du front Pulsar au hadoop user grouphttps://www.meetup.com/fr-FR/Hadoop-User-Group-France/events/264920447/Dataops rocks summit 2019https://www.dataops.rocks/fr/----------------------------------------------------------------ops et CloudLe guide de Chaos Engineering : Partie 1https://blog.wescale.fr/2019/09/26/le-guide-de-chaos-engineering-part-1/What’s Going on with GKE and Anthos?https://bravenewgeek.com/whats-going-on-with-gke-and-anthos/DataStax Apollo en Public Betahttps://www.datastax.com/constellation/datastax-apollo----------------------------------------------------------------Plateformes et base de donnéesAWS Elasticsearch: a fundamentally-flawed offeringhttps://spun.io/2019/10/10/aws-elasticsearch-a-fundamentally-flawed-offering/Delta: A Data Synchronization and Enrichment Platform (Netflix)https://medium.com/netflix-techblog/delta-a-data-synchronization-and-enrichment-platform-e82c36a79aeeHow does MVCC (Multi-Version Concurrency Control) workhttps://vladmihalcea.com/how-does-mvcc-multi-version-concurrency-control-work/Nouvelle certification Spark de Databrickshttps://blog.ippon.fr/2019/10/14/nouvelle-certification-spark-de-databricks/----------------------------------------------------------------DatascienceMeet Big Data Tools – Spark Integration and Zeppelin Notebooks in IntelliJ IDEAhttps://blog.jetbrains.com/scala/2019/10/16/meet-big-data-tools-spark-integration-and-zeppelin-notebooks-in-intellij-idea/150 successful machine learning models: 6 lessons learned at Booking.comhttps://blog.acolyer.org/2019/10/07/150-successful-machine-learning-models/----------------------------------------------------------------Meetups et conférences en tous genres22/10 - ParisDataEng' #15 ~ Data Engineering with Delta, Pulsar and Spark-toolshttps://www.meetup.com/fr-FR/Paris-Data-Engineers/events/264819837/?isFirstPublish=true05/11 - Paris Time Series Meetup - QuasarDB ou les séries temporelles appliquées à la finance et au transporthttps://www.meetup.com/fr-FR/Paris-Time-Series-Meetup/events/265669047/06/11 - Data Cloud Paris - 03 - Data Science sur Big Query et Azure + Optimisation Redshift !https://www.meetup.com/fr-FR/Data-Cloud-Paris/events/265638133/?isFirstPublish=true07/11 - Cassandra Meetup ?14 & 15/11 - Confluent Streaming Event Paris 2019https://www.confluent.io/online-talks/cse-paris-2019----------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttp://bit.ly/Invitebdh----------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Vincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech et Cerenit( http://affini-tech.com https://twitter.com/affinitech )( https://www.cerenit.fr/ et https://twitter.com/_CerenIT )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com----------------------------------------------------------------
19-10-2019 • 1 uur, 14 minuten, 40 seconden
Episode 85 : En direct du OVH Cloud Summit
Episode 85-------------------------------------------------------------OVH Cloud Summit -------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Vincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
12-10-2019 • 26 minuten, 5 seconden
Episode 84 : Kubernetes et Traefik sont de Maesh
Episode 84---------------------------------------------- Timeseries ---Paris Time Series Meetuphttps://www.meetup.com/fr-FR/Paris-Time-Series-Meetup/events/264517156/https://twitter.com/ParisTimeSerieshttps://youtu.be/6kFv_W6Y-Q0https://cloud.cerenit.fr/index.php/s/2BsPHPKiMa2pZj7-------------------------- Databases ---Paris | MongoDB.localhttps://mongodb.com/local/parisDemystifying LevelDBhttps://blog.senx.io/demystifying-leveldb/Prestohttps://thenewstack.io/facebooks-presto-big-data-query-engine-moves-to-the-linux-foundation/---------------------- Hadoop ---How Cloudera’s HBase Can Leverage Amazon’s S3https://blog.cloudera.com/how-clouderas-hbase-can-leverage-amazons-s3/Five Strata Takeawayshttps://blog.min.io/fivestratatakeaways/--------------------------- Kubernetes ---Traefik 2.0https://blog.containo.us/traefik-2-0-6531ec5196c2https://docs.traefik.io/migration/v1-to-v2https://github.com/containous/traefik-migration-tool/Maeshhttps://blog.containo.us/announcing-maesh-a-lightweight-and-simpler-service-mesh-made-by-the-traefik-team-cb866edc6f29https://mae.sh/C'est quoi un service meshhttps://www.redhat.com/fr/topics/microservices/what-is-a-service-meshWhy Does Developing on Kubernetes Suck?https://blog.tilt.dev/2019/08/21/why-does-developing-on-kubernetes-suck.html------------------- Spark ---Le packaging de job pysparkhttps://bigdatahebdo.slack.com/archives/C18M2REM7/p1570033527053400------------------------- Streaming ---Simple Event Processing with Apache Pulsar Functionshttps://streaml.io/blog/eda-simple-event-processingMeetup HUG FR le Vendredi 11 Oct sur Pulsarhttps://www.meetup.com/fr-FR/Hadoop-User-Group-France/events/264920447/-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comVincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
5-10-2019 • 1 uur, 6 minuten, 50 seconden
Episode 83 : Le Z il n'y a rien au dessus
Episode 83--------------------Cobol, 60 ans, toujours aux commandeshttps://www.lemondeinformatique.fr/actualites/lire-cobol-60-ans-toujours-aux-commandes-76385.htmlAvec le z15, IBM renforce la protection sur les donnéeshttps://www.lemondeinformatique.fr/actualites/lire-avec-le-z15-ibm-renforce-la-protection-sur-les-donnees-76420.htmlFiche technique du z15https://www.ibm.com/downloads/cas/NN7GBPJ1IBM Introduces Next-Gen Z Mainframe: The z15; Wider Cores, More Cores, More Cache, Still 5.2 GHzhttps://fuse.wikichip.org/news/2659/ibm-introduces-next-gen-z-mainframe-the-z15-wider-cores-more-cores-more-cache-still-5-2-ghz/New in Docker Hub: Personal Access Tokenshttps://blog.docker.com/2019/09/docker-hub-new-personal-access-tokens/Procella: unifying serving and analytical data at YouTube https://blog.acolyer.org/2019/09/11/procella/Hadoop is Dead. Long live Hadoophttps://medium.com/@acmurthy/hadoop-is-dead-long-live-hadoop-f22069b264acHot Chips 31 Live Blogs: Cerebras' 1.2 Trillion Transistor Deep Learning Processorhttps://www.anandtech.com/show/14758/hot-chips-31-live-blogs-cerebras-wafer-scale-deep-learningBeing a Data Scientist does not make you a Software Engineer!https://towardsdatascience.com/being-a-data-scientist-does-not-make-you-a-software-engineer-c64081526372"Say Hello World to event streaming."https://kafka-tutorials.confluent.io/Announcing Tutorials for Apache Kafkahttps://www.confluent.io/blog/announcing-apache-kafka-tutorialsZookeeper va donc bien être remplacé par du Raft embarqué!https://www.mail-archive.com/[email protected]/msg101172.htmlYugabyte passe les tests Jepsen... enfin presquehttps://twitter.com/jepsen_io/status/1174317882056040456?s=19-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comVincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
24-9-2019 • 1 uur, 7 minuten, 15 seconden
Episode 82 : Quand tu es idéaliste tu fais des listes
Episode 82 --------------------Time SeriesParis Time Series Meetup #1https://www.meetup.com/fr-FR/Paris-Time-Series-Meetup/events/264517156Telegraf 1.12https://www.influxdata.com/blog/release-announcement-telegraf-1-12-0/--------------------SparkHow I test with Apache Spark?https://medium.com/@nastasia.saby/how-i-test-with-apache-spark-97b2bacf0b77--------------------DatabasesAnnouncing the first Postgres extension to run WebAssemblyhttps://medium.com/wasmer/announcing-the-first-postgres-extension-to-run-webassembly-561af2cfcb1Pivotal Greenplum 6, Now GA, Uses PostgreSQL to Reimagine Modern Analytics at Scalehttps://content.pivotal.io/blog/pivotal-greenplum-6-now-ga-uses-postgresql-to-reimagine-modern-analytics-at-scalePresto Infrastructure at Lyfthttps://eng.lyft.com/presto-infrastructure-at-lyft-b10adb9db01Amazon Announces Generally Availability of Aurora Multi-Masterhttps://www.infoq.com/news/2019/09/aurora-multi-master-ga/--------------------HadoopLe site www.hortonworks.com redirige salement vers www.cloudera.comhttps://www.hortonworks.com What happend to hadoop ?https://architecht.io/what-happened-to-hadoop-211aa52a297New release of Cloud Storage Connector for Hadoop: Improving performance, throughput and morehttps://cloud.google.com/blog/products/data-analytics/new-release-of-cloud-storage-connector-for-hadoop-improving-performance-throughput-and-moreSamsung Announces Standards-Compliant Key-Value SSD Prototypehttps://www.anandtech.com/show/14839/samsung-announces-standardscompliant-keyvalue-ssd-prototype--------------------------Machine LearningPrediction with TensorFlow and Cloud Runhttps://medium.com/google-cloud/portable-prediction-with-tensorflow-and-cloud-run-669c1c73ebd1-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comVincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
11-9-2019 • 59 minuten, 55 seconden
Episode 81 : La vie est faite de choix surtout quand on traite de la data
Episode 81 Updated Microsoft licensing terms for dedicated hosted cloud serviceshttps://www.microsoft.com/en-us/licensing/news/updated-licensing-rights-for-dedicated-cloudMicrosoft hikes cost of licensing its software on rival public clouds, introduces Azure 'Dedicated' Hostshttps://www.theregister.co.uk/2019/08/05/microsoft_licensing_windows_clouds/Microsoft Screws Customers and its Own Advocates Alikehttps://www.lastweekinaws.com/blog/microsoft-screws-customers-and-its-own-advocates-alike/It's official: Deploying Facebook's 'Like' button on your website makes you a joint data slurperhttps://www.theregister.co.uk/2019/07/29/eu_gdpr_facebook_like_button/How Elizabeth Warren Came Up with a Plan to Break Up Big Techhttps://www.newyorker.com/business/currency/how-elizabeth-warren-came-up-with-a-plan-to-break-up-big-techBuilding petabyte-scale analytics with BigQuery and HLLhttps://medium.com/permutive/petabyte-analytics-with-bigquery-hll-af0f7a70b66dHyperLogLog ?https://fr.slideshare.net/doanduyhai/algorithmes-distribues-pour-le-big-data/3Support Apache Arrow dans l'API Bigquery storagehttps://medium.com/google-cloud/announcing-google-cloud-bigquery-version-1-17-0-1fc428512171Operational Analytics: What every software engineer should know about low-latency queries on large data setshttps://www.rockset.com/blog/operational-analytics-what-every-software-engineer-should-know/Announcing PartiQL: One query language for all your datahttps://aws.amazon.com/blogs/opensource/announcing-partiql-one-query-language-for-all-your-data/YuniKorn: a universal resources schedulerhttps://blog.cloudera.com/yunikorn-a-universal-resources-scheduler/Is Apache Hadoop still relevant?https://www.linkedin.com/pulse/apache-hadoop-still-relevant-tom-mccuch/HPE + MapR : trop de Hadoop, pas assez de cloud - Le Monde Informatiquehttps://www.lemondeinformatique.fr/actualites/lire-hpe-mapr-trop-de-hadoop-pas-assez-de-cloud-76149.html-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz -------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
27-8-2019 • 1 uur, 2 minuten, 4 seconden
Episode 80 : Ne met pas ta bigdata dans un SAN
HadoopHewlett Packard Enterprise fait l’acquisition de MapRhttps://www.zdnet.fr/actualites/hewlett-packard-enterprise-fait-l-acquisition-de-mapr-39888799.htmZookeeper 3.5https://zookeeper.apache.org/doc/r3.5.5/releasenotes.htmlhttps://zookeeper.apache.org/releases.html"DatabasePresto Unlimitedhttp://prestodb.github.io/blog/2019/08/05/presto-unlimited-mpp-database-at-scaleWarp10 2.1https://blog.senx.io/warp-10-version-2-1/La big data sur du virtualiséhttps://bigdatahebdo.slack.com/archives/C18M2REM7/p1565118704017000CouchDB 3 & 4https://mail-archives.apache.org/mod_mbox/couchdb-dev/201901.mbox/%[email protected]%3ECloudUne page se tourne pour le cloud souverain françaishttps://www.lesechos.fr/tech-medias/hightech/une-page-se-tourne-pour-le-cloud-souverain-francais-1118112Google Cloud’s run rate is now over $8Bhttps://techcrunch.com/2019/07/25/google-clouds-run-rate-is-now-over-8b/Le prix cloud : networkhttps://twitter.com/QuinnyPig/status/1155838435065655296La lecture du gartner cloud par corey Quinhttps://twitter.com/quinnypig/status/1153490824472043520?s=12Mesosphere s'appelle maintenant D2IQhttps://d2iq.com/blog/mesosphere-is-now-d2iq-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoAlexander : https://twitter.com/alexanderDejaQuentin Adam : https://twitter.com/waxczeSteven Le Roux : https://twitter.com/StevenLeRoux-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
16-8-2019 • 1 uur, 36 minuten, 35 seconden
Episode 79 : du neuf et du moins neuf
Time seriesRedisTimeSeries Module Adds Time Series Database Features to Redishttps://www.infoq.com/news/2019/07/redis-time-series-moduleRedisTimeSeries GA – Making the 4th dimension truly immersivehttps://redislabs.com/blog/redistimeseries-ga-making-4th-dimension-truly-immersive/How Hulu Uses InfluxDB and Kafka to Scale to Over 1 Million Metrics a Secondhttps://medium.com/hulu-tech-blog/how-hulu-uses-influxdb-and-kafka-to-scale-to-over-1-million-metrics-a-second-1721476aaff5CassandraStreaming Cassandra at WePay - Part 1https://wecode.wepay.com/posts/streaming-cassandra-at-wepay-part-1Streaming Cassandra at WePay - Part 2https://wecode.wepay.com/posts/streaming-cassandra-at-wepay-part-2Cassandra Exports as a Trivially Parallelizable Problemhttps://fr.slideshare.net/DataStax/cassandra-exports-as-a-trivially-parallelizable-problemDatastax : Momentum, Change, and Moving to the Futurehttps://www.datastax.com/2019/07/momentum-change-and-moving-to-the-futureDatabaseDemystifying Database Systems: Correctness Anomalies Under Serializable Isolationhttps://fauna.com/blog/demystifying-database-systems-correctness-anomalies-under-serializable-isolationData science“Oups, j’ai embauché un Data Scientist”https://medium.com/@paul.peton/oups-jai-embauch%C3%A9-un-data-scientist-18d3001056bcThe Data Engineering Cookbookhttps://www.linkedin.com/feed/update/urn:li:activity:6554425365945692160ré-identifier des individus au départ de bases de données anonymiséeshttps://www.lalibre.be/economie/entreprises-startup/ces-trois-chercheurs-belges-parviennent-a-re-identifier-des-individus-au-depart-de-bases-de-donnees-anonymisees-5d371b46f20d5a58a859a448-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comAlexander : https://twitter.com/alexanderDeja-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
29-7-2019 • 1 uur, 28 minuten, 54 seconden
Episode 78 : Les jeunes prennent les commandes
Time SeriesInfluxDays London 2019https://www.cerenit.fr/blog/influxdays-london-2019/How to Mix Metrics and Logs with Grafana and Influxhttps://grafana.com/blog/2019/06/27/how-to-mix-metrics-and-logs-with-grafana-and-influx/Meetup Time Series Parishttps://www.meetup.com/fr-FR/Paris-Time-Series-Meetup/Warp 10™ Raspberry Pi 4 bench for industrial IoThttps://blog.senx.io/warp-10-raspberry-bench-for-industrial-iot/DatabaseRetour d’utilisation de Mongodb et pourquoi nous migrons vers Postgresqlhttp://www.eventuallycoding.com/index.php/mongodb-vers-postgresql/Quel avenir pour PostgeSQL ?https://fljd.in/2019/07/04/quel-avenir-pour-postgresql/DataOur Commitment to Open Source Software - Cloudera Bloghttp://vision.cloudera.com/our-commitment-to-open-source-software/MapR still eyeing ‘strategic transaction’https://digitizingpolaris.com/mapr-still-eyeing-strategic-transaction-dca76fbe2958SQL Data Discovery and Classificationhttps://docs.microsoft.com/en-us/sql/relational-databases/security/sql-data-discovery-and-classification?view=sql-server-2017Moment Données, l'apéro datahttps://soundcloud.com/moment-donnees/moment-donnees-lapero-data-episode-piloteSouverainté numériqueRapport Gauvainhttp://web.lexisnexis.fr/LexisActu/rapport-gauvain.pdfCE Souveraineté numériquehttp://videos.senat.fr/video.1261462_5d270ffb865c9.ce-souverainete-numeriqueLe numérique à l’Assemblée nationale : où en est-on ?https://www.institutmontaigne.org/blog/le-numerique-lassemblee-nationale-ou-en-estOutscale en passe de devenir le Cloud souverain que la France attendhttps://www.lemagit.fr/actualites/252466046/Outscale-en-passe-de-devenir-le-Cloud-souverain-que-la-France-attendAutreCes nouveaux troubles mentaux qui frappent les entrepreneurshttps://www.lesechos.fr/amp/1019511Elastic Search Awardshttps://www.elastic.co/fr/elastic-search-awards-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.com-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
15-7-2019 • 1 uur, 12 minuten, 9 seconden
Episode 77 : Elassandra, mémoires géantes, et bases de données
Nous recevons pour cet épisode Vincent Royer qui vient nous parler d'Elassandra dont il est le créateur et de plein d'autres choseshttp://www.elassandra.io/https://twitter.com/elassandraioPour en savoir plus c'est dans l'Episode 46Se préparer à la NVRAM : Intel 3D Xpoint débarque bientôthttps://www.zdnet.fr/actualites/se-preparer-a-la-nvram-intel-3d-xpoint-debarque-bientot-39882653.htmTiDB 2.1.7https://jepsen.io/analyses/tidb-2.1.7mattm/sql-style-guidehttps://github.com/mattm/sql-style-guide2019 Open Source Database Report: Top Databases, Public Cloud vs. On-Premise, Polyglot Persistencehttps://scalegrid.io/blog/2019-open-source-database-report-top-databases-public-cloud-vs-on-premise-polyglot-persistence/SNOWFLAKE DATA PIPELINEShttps://www.snowflake.com/blog/snowflake-data-pipelines/What’s New in Apache Kafka 2.3https://www.confluent.io/blog/whats-new-in-apache-kafka-2-3"Cloud Computing (Dossier) Programmez, juin 2019"https://www.programmez.com/magazine/programmez-230-pdfServerless with Knative (Mete Atamel, Nikhil Barthwal)https://www.youtube.com/watch?v=iV20uCDxu1YRetour sur Dataxday : "Mettre en prod la datascience"https://dataxday.fr/-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent Royer : https://twitter.com/vroyervJérôme : https://twitter.com/jxerome et https://www.zeenea.comAlexander : https://twitter.com/alexanderDejaVincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
2-7-2019 • 1 uur, 40 minuten, 49 seconden
Episode 76 : L'As des Aces
Looker to Join Google Cloudhttps://looker.com/blog/looker-to-join-google-cloudRachat de Tableau par Salesforcehttps://techcrunch.com/2019/06/10/salesforce-is-buying-data-visualization-company-tableau-for-15-7b-in-all-stock-deal/https://realmoney.thestreet.com/investing/technology/salesforce-deal-for-tableau-takeaways-14986369Cassandra Meetup (canal historique)https://www.meetup.com/fr-FR/Cassandra-Paris-Meetup/events/261869169/Storm 2.0.0 Releasedhttps://storm.apache.org/2019/05/30/storm200-released.htmlWhy We’re Relicensing CockroachDBhttps://www.cockroachlabs.com/blog/oss-relicensing-cockroachdb/OVH avance d’un pied fermehttps://www.ovh.com/fr/blog/ovh-avance-dun-pied-ferme/Predictive CPU isolation of containers at Netflixhttps://medium.com/netflix-techblog/predictive-cpu-isolation-of-containers-at-netflix-91f014d856c7Traitement Automatique du Langage sur du texte en 2019 (Alexis Agahi)https://www.youtube.com/watch?v=pOfk7UbUIRIGoogle launches TensorFlow.Text library for language AI modelshttps://venturebeat.com/2019/06/10/google-launches-tensorflow-text-library-for-language-ai-models/-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoJérôme : https://twitter.com/jxerome et https://www.zeenea.comAlexander : https://twitter.com/alexanderDejaVincent : https://twitter.com/vhe74-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
22-6-2019 • 1 uur, 29 minuten, 22 seconden
Episode 75 : the clever, the safe and the ugly
Clever Cloud identity, reloadedhttps://www.clever-cloud.com/blog/company/2019/05/27/clever-cloud-new-logo/Big-data bombshell: MapR may shut down as investor pulls out after ‘extremely poor results’https://siliconangle.com/2019/05/30/mapr-may-shut-investor-pulls-following-extremely-poor-results/Update de MAPR https://mapr.com/blog/an-update-from-mapr/Dependabot is Now Free and It’s Amazinghttps://nimbleindustries.io/2019/05/26/dependabot-is-now-free-and-its-amazing/NoSQLSecurity for Elasticsearch is now freehttps://www.elastic.co/blog/security-for-elasticsearch-is-now-freeElasticsearch on Kubernetes: A new chapter beginshttps://www.elastic.co/blog/introducing-elastic-cloud-on-kubernetes-the-elasticsearch-operator-and-beyondErratum licence Elastic Canvashttps://www.elastic.co/fr/subscriptionsDataStax Announces Constellation, a Cloud-Native Data Platformhttps://www.datastax.com/2019/05/datastax-announces-constellation-a-cloud-native-data-platformEliot's Weekly MongoDB World Challengehttps://eliotsweeklymongodbworldchallenge.mongodb.eventsKubernetesKubeCon + CloudNativeCon Europe 2019https://www.cerenit.fr/blog/kubecon-2019/A la découverte de Jenkins X : Programmez, mai 2019, Nicolas de LoofPub/SubReducing Operational Overhead with Pulsar Functionshttp://www.jesse-anderson.com/2019/05/reducing-operational-overhead-with-pulsar-functions/CloudStockage cloud : OVH et Scaleway cassent les prix face aux Américainshttps://www.journaldunet.com/solutions/cloud-computing/1423764-pricing-du-stockage-cloud-scaleway-prend-le-contre-pied-du-marche/Les actionnaires d’Amazon décident de ne pas limiter la reconnaissance facialehttps://siecledigital.fr/2019/05/26/amazon-decident-ne-pas-limiter-reconnaissance-faciale/-------------------------------------------------------------Venez nombreux au Google Cloud SummitOn vous attends sur le stand Affini-TechPour s'inscrire c'est là : http://bit.ly/GoogleCloudParis2019-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoQuentin : https://twitter.com/waxzceJérôme : https://twitter.com/jxerome et https://www.zeenea.comAlexander : https://twitter.com/alexanderDeja-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
5-6-2019 • 1 uur, 36 minuten, 44 seconden
Episode 74 : Le soldat wsl2 sauvera t’il la cogip ?
Snips Open Sources Tracthttps://medium.com/snips-ai/snips-open-sources-tract-cdc50f437ef2AI Weekly: Google’s ethics council barely lasted a week, but there’s a thin silver lininghttps://venturebeat.com/2019/04/05/ai-weekly-googles-ethics-council-barely-lasted-a-week-but-theres-a-thin-silver-lining/Google ouvre un centre mondial dédié à la vie privée en Europehttp://www.lefigaro.fr/secteur/high-tech/google-ouvre-un-centre-mondial-dedie-a-la-vie-privee-en-europe-20190514Thoughtworks Technology Radar vol 20 - Avril 2019https://www.thoughtworks.com/radarData Lake + Data Warehouse in One Box using Snowflakehttps://blog.persistent.com/index.php/2019/05/07/data-lake-dwh-in-one-box-using-snowflake/Announcing WSL 2https://devblogs.microsoft.com/commandline/announcing-wsl-2/New – The Next Generation (I3en) of I/O-Optimized EC2 Instanceshttps://aws.amazon.com/blogs/aws/new-the-next-generation-i3en-of-i-o-optimized-ec2-instances/Venez nombreux au Google Cloud SummitOn vous attends sur le stand Affini-TechPour s'inscrire c'est là : http://bit.ly/GoogleCloudParis2019Data Cloud and Co : un vlog pour vous parler de comment on utilise le Cloud pour construire des plateformes Datahttps://www.youtube.com/channel/UCVGxBvIEhduF93L6tXY13hg-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comAlexander : https://twitter.com/alexanderDeja-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
18-5-2019 • 1 uur, 4 minuten, 29 seconden
Episode 73 : Si t'as pas le mode sombre t'as raté ta vie
Venez nombreux au Google Cloud SummitOn vous attends sur le stand Affini-TechPour s'inscrire c'est là : http://bit.ly/GoogleCloudParis2019Elastic Stack 7.0.0 releasedhttps://www.elastic.co/blog/elastic-stack-7-0-0-releasedKafka : Migrer un consommateur vers Streams et Connecthttp://blog.ippon.fr/2019/04/29/rex-migrer-un-consommateur-vers-streams-et-connect/The PipelineDB Team Joins Confluenthttps://www.confluent.io/blog/pipelinedb-team-joins-confluenthttps://www.pipelinedb.com/blog/pipelinedb-is-joining-confluentIntroduction à Apache Pulsarhttps://speakerdeck.com/bbonnin/introduction-a-apache-pulsarFor Open Source, It's All About GitHub Nowhttps://www.wired.com/story/open-source-all-about-github-now/https://www.developpez.com/actu/258130/Apache-Software-Foundation-rejoint-la-communaute-open-source-de-GitHub-et-met-fin-a-son-propre-service-git/Cluster Spark éphémère avec Terraform et AWS EMRhttp://blog.ippon.fr/2019/04/16/cluster-spark-ephemere-avec-terraform-et-aws-emr/Facebook Tells Congress New Zealand Shooting Video Wasn’t ‘Gruesome’ Enough to Flaghttps://www.thedailybeast.com/facebook-tells-congress-new-zealand-shooting-video-wasnt-gruesome-enough-to-flag-------------------------------------------------------------Venez nombreux au Google Cloud SummitOn vous attends sur le stand Affini-TechPour s'inscrire c'est là : http://bit.ly/GoogleCloudParis2019-------------------------------------------------------------Rejoignez le Slack du Bigdata Hebdohttps//bit.ly/invitebdh-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comAlexander : https://twitter.com/alexanderDeja-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
4-5-2019 • 1 uur, 24 minuten, 49 seconden
Episode 72 : WARP 10 avec Mathias Herberts
Warp 10 : https://www.warp10.io/Warp Fleethttps://warpfleet.senx.io/le twitter de Warp 10 https://twitter.com/warp10ioEt pour aller encore plus loin : https://twitter.com/WarpScriptLa société SenXhttps://senx.io/Le Twitter de SenXhttps://twitter.com/senxhqPour retrouver Mathias Herberts https://twitter.com/herbertshttps://www.linkedin.com/in/herberts/-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoRejoignez le Slackhttps://bit.ly/invitebdhVincent : https://twitter.com/vhe74 et http://blog.affini-tech.comCette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-----------------------------------------
22-4-2019 • 49 minuten, 46 seconden
Episode 71 : Google Cloud Next 19
Le slack est ouvert !http://bit.ly/invitebdhLancement d'Anthoshttps://cloud.google.com/blog/topics/hybrid-cloud/new-platform-for-managing-applications-in-todays-multi-cloud-worldCloud Runhttps://cloud.google.com/blog/products/serverless/announcing-cloud-run-the-newest-member-of-our-serverless-compute-stackCompute-optimized VM + Memory-optimized VMhttps://cloud.google.com/blog/products/compute/introducing-compute-and-memory-optimized-vms-for-google-compute-engineConfluenthttps://www.confluent.io/blog/announcing-confluent-cloud-for-apache-kafka-native-service-on-google-cloud-platformMoving from Cassandra to Auto-Scaling Bigtable at Spotifyhttps://www.youtube.com/watch?v=Hfd3VZOYXNUhttps://labs.spotify.com/2018/12/18/bigtable-autoscaler-saving-money-and-time-using-managed-storage/Bigquery BI Enginehttps://cloud.google.com/bi-engine/docs/BigQuery Storage APIhttps://cloud.google.com/bigquery/docs/reference/storage/Bigquery Flat rate pricinghttps://cloud.google.com/bigquery/pricing#flat_rate_pricingBigquery streaming inserthttps://cloud.google.com/blog/products/gcp/life-of-a-bigquery-streaming-insertBigquery ML : Kmeanshttps://medium.com/@lakshmanok/how-to-use-k-means-clustering-in-bigquery-ml-to-understand-and-describe-your-data-better-c972c6f5733bBigquery ML with TF modelshttps://towardsdatascience.com/how-to-do-batch-predictions-of-tensorflow-models-directly-in-bigquery-ffa843ebdba6Auto ML Tableshttps://cloud.google.com/automl-tables/Cloud Data Fusionhttps://cloud.google.com/data-fusion/Data cataloghttps://cloud.google.com/data-catalog/Document Understanding AIhttps://cloud.google.com/solutions/document-understanding/DAY 1 recaphttps://cloud.google.com/blog/topics/inside-google-cloud/next19-recap-day1DAY 2 recaphttps://cloud.google.com/blog/topics/inside-google-cloud/day-2-next-19-working-smarter-better-and-more-securely-cloudToute les vidéos https://www.youtube.com/user/googlecloudplatform/videos-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoRejoignez le Slackhttps://bit.ly/invitebdhVincent : https://twitter.com/vhe74 et http://blog.affini-tech.comJérôme : https://twitter.com/jxerome et https://www.zeenea.comCette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-----------------------------------------
13-4-2019 • 1 uur, 9 minuten, 39 seconden
Episode 70 : Les bonnes questions
Bigdata ParisRetour rapide sur Big Data ParisLes bonnes questionsMaybe You Don't Need Kuberneteshttps://matthias-endler.de/2019/maybe-you-dont-need-kubernetes/Secret Design Docs: Multi-Tenant Orchestratorhttps://blog.jessfraz.com/post/secret-design-docs-multi-tenant-orchestrator/Was MongoDB Ever the Right Choice?https://www.simplethread.com/was-mongodb-ever-the-right-choice/DatabaseSnowflake: The Good, The Bad and The Uglyhttps://0x0fff.com/snowflake-the-good-the-bad-and-the-ugly/KAFKA World Confluent's Kafka distro adds dev, management and hybrid cloud capabilitieshttps://www.zdnet.com/article/confluents-kafka-distro-adds-dev-management-and-hybrid-cloud-capabilities/Event Hubshttps://azure.microsoft.com/fr-fr/services/event-hubs/Event Streaminghttps://www.mapr.com/products/mapr-streamsIntroducing Confluent Platform 5.2https://www.confluent.io/blog/introducing-confluent-platform-5-2JDKJDK Comparison Matrix for the Enterprisehttps://www.azul.com/products/zulu-enterprise/jdk-comparison-matrix/Java is Still Free 2.0.3https://medium.com/@javachampions/java-is-still-free-2-0-0-6b9aa8d6d244
8-4-2019 • 1 uur, 13 minuten, 57 seconden
Episode 69 : Le dilemme de Batman
OSS for ever !Keeping Open Source Open – Open Distro for Elasticsearchhttps://aws.amazon.com/blogs/opensource/keeping-open-source-open-open-distro-for-elasticsearch/Supporting The Apache Software Foundationhttps://aws.amazon.com/blogs/opensource/supporting-apache-software-foundation/On "Open" Distros, Open Source, and Building a Companyhttps://www.elastic.co/blog/on-open-distros-open-source-and-building-a-companyAWS intends for their new project to be an Elasticsearch forkhttps://www.influxdata.com/blog/aws-intends-for-their-new-project-to-be-an-elasticsearch-fork/Free Software is the only winner in Elastic NV vs AWShttps://medium.com/@adamhjk/free-software-is-the-only-winner-in-elastic-nv-vs-aws-9416f2a0a7f5Redis Labs drops Commons Clause for a new licensehttps://www.zdnet.com/article/redis-labs-drops-commons-clause-for-a-new-license/HardwareNouvelles instances General Purpose avec des processeurs haut de gammehttps://blog.scaleway.com/2019/instances-general-purpose-haut-de-gamme/GPU Instanceshttps://www.scaleway.com/gpu-instances/NVIDIA to Acquire Mellanoxhttps://news.developer.nvidia.com/nvidia-to-acquire-mellanox/#10. Benjamin Barthe - HPC aka High Performance Computinghttps://www.spreaker.com/user/guignol/ep10-benjamin-barthe-hpc-finalDivers Introducing the Continuous Delivery Foundation, the new home for Tekton, Jenkins, Jenkins X and Spinnakerhttps://opensource.googleblog.com/2019/03/introducing-continuous-delivery-foundation.htmlContinuous Delivery Foundation, with Tracy Mirandattps://kubernetespodcast.com/episode/044-continuous-delivery-foundation/Virtual tables are coming in Cassandra 4.0http://thelastpickle.com/blog/2019/03/08/virtual-tables-in-cassandra-4_0.htmlAnalytics Data Compute powered by Apache Sparkhttps://labs.ovh.com/analytics-data-computeLa veille technologique dans la Datahttps://blog.ippon.fr/2019/03/13/la-veille-techno-dans-la-data/-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74 et http://blog.affini-tech.comNicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comAlexander : https://twitter.com/alexanderDejaCette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-----------------------------------------
17-3-2019 • 1 uur, 6 minuten, 56 seconden
Episode 68 : KaaS la baraque
Cloud et open sourceLa bataille entre vrai open source et faux open source s'intensifiehttps://www.zdnet.fr/actualites/la-bataille-entre-vrai-open-source-et-faux-open-source-s-intensifie-39881007.htmLes fournisseurs cloud, bourreaux de l'open source ?https://www.zdnet.fr/actualites/les-fournisseurs-cloud-bourreaux-de-l-open-source-39881337.htmLCC 205 - Interview analyse de l'industrie avec Sacha Laboureyhttps://lescastcodeurs.com/2019/02/21/lcc-205-interview-analyse-de-l-industrie-avec-sacha-labourey/KubernetesManaged Kubernetes Servicehttps://www.ovh.com/fr/kubernetes/Kubernetes as a Service : OVH dévoile sa nouvelle arme en version finalehttps://www.journaldunet.com/solutions/cloud-computing/1421810-kubernetes-as-a-service-ovh-devoile-son-offre-en-version-finale/Google Cloud Services Platform disponible en version bêtahttps://www.silicon.fr/google-cloud-services-platform-disponible-en-version-beta-233283.htmlDatabaseWhy we built CockroachDB on top of RocksDBhttps://www.cockroachlabs.com/blog/cockroachdb-on-rocksd/Easier Relevance Tuning in Elasticsearch 7.0https://www.elastic.co/blog/easier-relevance-tuning-elasticsearch-7-0Apache Cassandra - Data Center Switchhttp://thelastpickle.com/blog/2019/02/26/data-center-switch.htmlGrafana v6.0 Releasedhttps://grafana.com/blog/2019/02/25/grafana-v6.0-released/farewell to fsync(): 10× faster database tests with Dockerhttps://pythonspeed.com/articles/faster-db-tests/Machine LearningContre les usurpations de plaques d’immatriculation, l’État mise sur l’intelligence artificiellehttps://www.nextinpact.com/news/107516-contre-usurpations-plaques-dimmatriculation-letat-mise-sur-lintelligence-artificielle.htm-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comAlexander : https://twitter.com/alexanderDeja-------------------------------------------------------------Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-------------------------------------------------------------
4-3-2019 • 1 uur, 17 minuten, 58 seconden
Episode 67 : Uber GPU Database
DatabaseUnderstanding Database Shardinghttps://www.digitalocean.com/community/tutorials/understanding-database-shardingIntroducing AresDB: Uber’s GPU-Powered Open Source, Real-time Analytics Enginehttps://eng.uber.com/aresdb/NoSQL for the serverless age: Announcing Cloud Firestore general availability and updateshttps://cloud.google.com/blog/products/databases/announcing-cloud-firestore-general-availability-and-updates/Deux ans après l’infection, des bases de données MongoDB attendent encore que la rançon soit payéehttps://www.zdnet.fr/amp/actualites/deux-ans-apres-l-infection-des-bases-de-donnees-mongodb-attendent-encore-que-la-rancon-soit-payee-39880381.htmTSL: a developer-friendly Time Series query language for all our metricshttps://www.ovh.com/fr/blog/tsl-a-developer-friendly-time-series-query-language-for-all-our-metrics/Elastic App Search passe aux moteurs de recherche multilingueshttps://www.elastic.co/fr/blog/introducing-multi-language-engines-in-elastic-app-searchReaper 1.4 Releasedhttp://thelastpickle.com/blog/2019/02/15/reaper-1_4-released.htmlCloudTop 2019 des fournisseurs de cloud : AWS, Azure, GCP ; IBM sur l'hybride et Salesforce domine le SaaShttps://www.zdnet.fr/actualites/top-2019-des-fournisseurs-de-cloud-aws-azure-gcp-ibm-sur-l-hybride-et-salesforce-domine-le-saas-39880577.htmGoogle and Microsoft Warn That AI May Do Dumb Thingshttps://www.wired.com/story/google-microsoft-warn-ai-may-do-dumb-things/The curse of the data lake monsterhttps://www.thoughtworks.com/insights/blog/curse-data-lake-monster
18-2-2019 • 1 uur, 12 minuten, 3 seconden
Episode 66 : Papa est de retour
KafkaConfluent Raises a $125M Series D Funding Roundhttps://www.confluent.io/blog/confluent-raises-a-125m-series-d-funding-roundDatabasesInfluxDB 2.0 Alpha Release and the Road Aheadhttps://www.influxdata.com/blog/influxdb-2-0-alpha-release-and-the-road-ahead/Introducing the Next-Generation InfluxDB 2.0 Platformhttps://www.influxdata.com/blog/introducing-the-next-generation-influxdb-2-0-platform/Microsoft Acquires Citus Data: Creating the World’s Best Postgres Experience Togetherhttps://www.citusdata.com/blog/2019/01/24/microsoft-acquires-citus-data/Elastic Stack 6.6.0 Releasedhttps://www.elastic.co/blog/elastic-stack-6-6-0-released14 Things To Do When Setting Up a New Cassandra Clusterhttp://thelastpickle.com/blog/2019/01/30/new-cluster-recommendations.htmlCloudQuel cloud pour la Russie ?http://blog.ippon.fr/2019/01/25/quel-cloud-pour-la-russie/La malédiction des géants... ou pourquoi nous devons contrer les monopoles de la techhttps://www.ladn.eu/edito/dangers-monopole-gafa/Game of Clouds: Lock-In Is Cominghttps://www.zdnet.com/article/game-of-clouds-lock-in-is-coming/The joy and pain of using Google BigTablehttps://syslog.ravelin.com/the-joy-and-pain-of-using-google-bigtable-4210604c75beKubernetesDatabase Operators Bring Stateful Workloads to Kuberneteshttps://thenewstack.io/databases-operators-bring-stateful-workloads-to-kubernetes/-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comAlexander : https://twitter.com/alexanderDejaCette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-----------------------------------------
4-2-2019 • 1 uur, 19 minuten, 53 seconden
Episode 65 : La famille s'agrandit
DatabaseThe Guardian’s Migration from MongoDB to PostgreSQL on Amazon RDShttps://www.infoq.com/news/2019/01/guardian-mongodb-postgresqlSQL is Dead, Hail to Fluxhttp://bit.ly/2CrzERXInfrastructureBlog: APIServer dry-run and kubectl diffhttps://kubernetes.io/blog/2019/01/14/apiserver-dry-run-and-kubectl-diff/Infrastructure as real codehttps://gianarb.it/blog/infrastructure-as-real-codeDatascienceAn Introduction to the Machine Learning Platform as a Servicehttp://bit.ly/2AHpv2tWhy Dask ?http://docs.dask.org/en/latest/why.htmlResearchers Fool ReCAPTCHA With Google’s Own Speech-To-Text Servicehttps://motherboard.vice.com/en_us/article/pa55z8/researchers-fool-recaptcha-with-googles-own-speech-to-text-serviceRenseignement : la DGSI s’émancipe de Palantirhttp://bit.ly/2TQzCJqAutresMore Start-Ups Have an Unfamiliar Message for Venture Capitalists: Get Losthttps://nyti.ms/2H6WsecActionnaires VS Dirigeants : ce que veulent les entreprises - Heu?reka #27https://www.youtube.com/watch?v=aIOUlRtCDKkWhy 2019 could be the year of another tech bubble crashhttp://bit.ly/2H7mtds-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Nicolas : https://www.cerenit.fr/ et https://twitter.com/_CerenIT et https://twitter.com/nsteinmetz Jérôme : https://twitter.com/jxerome et https://www.zeenea.comCette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-----------------------------------------
21-1-2019 • 1 uur, 10 minuten, 12 seconden
Episode 64 : Happy New Year 2019
Episode 64 : “Happy new year 2019” -----------------------------AI predictions for 2019 from Yann LeCun, Hilary Mason, Andrew Ng, and Rumman Chowdhury | VentureBeathttps://venturebeat.com/2019/01/02/ai-predictions-for-2019-from-yann-lecun-hilary-mason-andrew-ng-and-rumman-chowdhury/Interview de Yann Le Cun https://anchor.fm/ouiareny/episodes/3-Yann-LeCun-Facebook--Comment-lexcellence-scientifique-Franaise-brille-chez-Facebook-e2pt9p/a-a7tui6-----------------------------In the CloudBigtable Autoscaler: saving money and time using managed storagehttps://labs.spotify.com/2018/12/18/bigtable-autoscaler-saving-money-and-time-using-managed-storage/Will Kubernetes Sink the Hadoop Ship?https://thenewstack.io/will-kubernetes-sink-the-hadoop-ship/-----------------------------DatabaseHas FaunaDB Cracked the Code for Global Transactionality?https://www.datanami.com/2018/12/12/has-faunadb-cracked-the-code-for-global-transactionality/They scaled YouTube — now they’ll shard everyone with PlanetScale (Vitess)https://techcrunch.com/2018/12/13/planetscale/https://vitess.io/-----------------------------OSSLicense Changes for Confluent Platformhttps://www.confluent.io/blog/license-changes-confluent-platformA Developer’s Guide to the Confluent Community Licensehttps://www.confluent.io/blog/developers-guide-confluent-community-licenseOpen source confronts its midlife crisishttp://dtrace.org/blogs/bmc/2018/12/14/open-source-confronts-its-midlife-crisis/We need Sustainable Free and Open Source Communitieshttps://medium.com/sustainable-free-and-open-source-communities/we-need-sustainable-free-and-open-source-communities-edf92723d619-----------------------------DatascienceStandardizing on Keras: Guidance on High-level APIs in TensorFlow 2.0https://medium.com/tensorflow/standardizing-on-keras-guidance-on-high-level-apis-in-tensorflow-2-0-bad2b04c819a-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alex : https://twitter.com/alexanderDejaCette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-----------------------------------------
6-1-2019 • 1 uur, 11 minuten, 34 seconden
Episode 63 : “Re-Invent le Cloud”
Episode 63 : “Re-Invent le Cloud” -----------------------------In the CloudAmazon Timestreamhttps://aws.amazon.com/fr/timestream/Amazon Forecast – Time Series Forecasting Made Easyhttps://aws.amazon.com/fr/blogs/aws/amazon-forecast-time-series-forecasting-made-easy/Amazon DynamoDB On-Demand – No Capacity Planning and Pay-Per-Request Pricinghttps://aws.amazon.com/fr/blogs/aws/amazon-dynamodb-on-demand-no-capacity-planning-and-pay-per-request-pricing/Amazon Quantum Ledger Database (QLDB)https://aws.amazon.com/fr/qldb/https://aws.amazon.com/fr/managed-blockchain/Announcing Amazon Aurora Global Databasehttps://aws.amazon.com/fr/about-aws/whats-new/2018/11/announcing-amazon-aurora-global-database/AWS OutpostsRun AWS infrastructure on-premises for a truly consistent hybrid experiencehttps://aws.amazon.com/fr/outposts/AWS Lake Formationhttps://aws.amazon.com/fr/lake-formation/DatabaseEDB Postgres Cloud Database Servicehttps://www.enterprisedb.com/edb-postgres-cdsTiKV : A distributed transactional key-value databasehttps://tikv.org/https://github.com/pingcap/tidbKafka worldAmazon MSKhttps://aws.amazon.com/fr/about-aws/whats-new/2018/11/introducing-amazon-managed-streaming-for-kafka-in-public-preview/An Honest Review of AWS Managed Apache Kafka: Amazon MSKhttps://medium.com/@stephane.maarek/an-honest-review-of-aws-managed-apache-kafka-amazon-msk-94b1ff9459d8AWS Launches Managed Kafka: Is It “Strip Mining” Open Source?https://www.cbronline.com/analysis/aws-managed-kafka/amp/?__twitter_impression=trueSamza 1.0: Stream Processing at Massive Scalehttps://engineering.linkedin.com/blog/2018/11/samza-1-0--stream-processing-at-massive-scale-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alex : https://twitter.com/alexanderDejaCette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à recrutement@affini-tech.com-----------------------------------------
15-12-2018 • 1 uur, 12 minuten
Episode 62 : This is what happens Larry
In the CloudCloud Data Warehouse Benchmark: Redshift, Snowflake, Azure, Presto, BigQueryhttps://fivetran.com/blog/warehouse-benchmarkExtending the SQL capabilities of your Cloud Dataproc cluster with the Presto optional componenthttps://cloud.google.com/blog/products/data-analytics/extending-the-sql-capabilities-of-your-cloud-dataproc-cluster-with-the-presto-optional-componentGive meaning to 100 billion analytics events a dayhttps://medium.com/teads-engineering/give-meaning-to-100-billion-analytics-events-a-day-d6ba09aa8f44Introducing Amazon Corretto, a No-Cost Distribution of OpenJDK with Long-Term Supporthttps://aws.amazon.com/fr/blogs/opensource/amazon-corretto-no-cost-distribution-openjdk-long-term-support/Uber’s Big Data Platform: 100+ Petabytes with Minute Latencyhttps://eng.uber.com/uber-big-data-platform/https://eng.uber.com/hoodie/AWS Releases New Pricing Calculatorhttps://www.cbronline.com/news/aws-pricing-calculatorWill Cloud Computing Kill Open Source Development?https://www.infoq.com/articles/will-cloud-computing-kill-open-sourceDatabase“This is What Happens Larry”: Amazon Finally Dumps Oracle Data Warehousehttps://www.cbronline.com/news/aws-oracle-data-warehouseCockroachDB 2.0 geo-partitioninghttps://www.youtube.com/watch?v=v2QK5VgLx6ETiKV : A distributed transactional key-value databasehttps://tikv.org/https://github.com/pingcap/tidbKafka worldCertifs pour la communauté !!! DatascienceUber Introduces PyML: Their Secret Weapon for Rapid Machine Learning Developmenthttps://towardsdatascience.com/uber-introduces-pyml-their-secret-weapon-for-rapid-machine-learning-development-c0f40009a617Paperspace gradient : Saas datascience platformhttps://www.paperspace.com/gradientPandora wants to map the “podcast genome” so it can recommend your next favorite showhttp://www.niemanlab.org/2018/11/pandora-wants-to-map-the-podcast-genome-so-it-can-recommend-your-next-favorite-show/-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alex : https://twitter.com/alexanderDejaCette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
26-11-2018 • 1 uur, 11 minuten, 41 seconden
Episode 61 : Retour aux (open) sources
In the CloudIBM to Acquire Linux Distributor Red Hat for $33.4 Billionhttps://www.bloomberg.com/news/articles/2018-10-28/ibm-is-said-to-near-deal-to-acquire-software-maker-red-hatHDFS vs. Cloud Storage: Pros, cons and migration tipshttps://cloud.google.com/blog/products/storage-data-transfer/hdfs-vs-cloud-storage-pros-cons-and-migration-tipsNew Cloudera Plots a Course Toward a Unified Futurehttps://www.datanami.com/2018/10/24/new-cloudera-plots-a-course-toward-a-unified-future/Building a Serverless End-to-End Solution for Brand Detection in Video with GCPhttps://medium.com/@juri.sarbach/building-a-serverless-end-to-end-solution-for-brand-detection-in-video-fa5a2cd64b4dDatabaseDataStax Announces DataStax Distribution of Apache Cassandra™https://www.datastax.com/2018/11/datastax-announces-datastax-distribution-of-apache-cassandrahttps://www.datastax.com/2018/11/datastax-and-the-cassandra-communityCQL Data Modeling toolhttps://www.sestevez.com/sestevez/CassandraDataModeler/CockroachDB release 2.1 + Managed cloud Cockroachhttps://www.cockroachlabs.com/blog/cockroachdb-2dot1-release/https://www.cockroachlabs.com/blog/launching-managed-cockroachdb/Debezium (CDC)https://debezium.io/docs/faq/Divers Data Buzzword Podcast https://www.spreaker.com/show/jean-louis-queguiners-show-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alex : https://twitter.com/alexanderDejaCette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
10-11-2018 • 1 uur, 10 minuten, 19 seconden
Episode 60 : J'peux pas j'ai Nouvelle Zelande
-----------------------------HadoopCloudera and Hortonworks merger means Hadoop’s influence is declininghttps://venturebeat.com/2018/10/06/cloudera-and-hortonworks-merger-means-hadoops-influence-is-declining/-----------------------------DatabaseSnowflakehttps://www.frenchweb.fr/cloud-450-millions-de-dollars-pour-la-licorne-franco-americaine-snowflake/338077NewSQL database systems are failing to guarantee consistency, and I blame Spannerhttp://dbmsmusings.blogspot.com/2018/09/newsql-database-systems-are-failing-to.htmlGoogle Cloud Spanner: the good, the bad and the uglyhttps://medium.com/@LightspeedHQ/google-cloud-spanner-the-good-the-bad-and-the-ugly-5795f37a7684Microsoft updates its planet-scale Cosmos DB database servicehttps://techcrunch.com/2018/09/24/microsoft-updates-its-planet-scale-cosmos-db-database-service/?guccounter=1Spotify cstarhttp://thelastpickle.com/blog/2018/10/01/introduction-to-cstar.htmlhttp://thelastpickle.com/blog/2018/10/09/cstar-custom-commands.html-----------------------------Kafka landA Major Step Forward for Apache Pulsar: New Top-Level Apache Projecthttps://streaml.io/blog/major-step-forward-apache-pulsar-top-levelhttps://www.datanami.com/2018/03/06/streamlio-claims-pulsar-performance-advantages-kafka/Kafka dispo sur google cloud platformhttps://cloud.google.com/blog/big-data/2018/05/google-cloud-platform-and-confluent-partner-to-deliver-a-managed-apache-kafka-service-----------------------------DiversXebia + Publicis https://resource.globenewswire.com/Resource/Download/a6a8f461-cc36-4f07-8403-6cf7ec5ed1fd-----------------------------Lisez le blog d'Affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdejaCette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
25-10-2018 • 1 uur, 13 minuten, 9 seconden
Episode 59 : We are back !
DatabaseA new Compaction strategy for Cassandrahttps://blog.pythian.com/proposal-for-a-new-cassandra-cluster-key-compaction-strategy/Apache Cassandra Performance Tuning - Compression with Mixed Workloadshttp://thelastpickle.com/blog/2018/08/08/compression_performance.htmlReaper donated to the Apache Cassandra projecthttps://lists.apache.org/thread.html/12a870479d78bb4e45a616fdb9ea17743ec864ca1ed1f0c75f9f5071@%3Cdev.cassandra.apache.org%3EOrigins of Apache Cassandra with Jonathan Ellis and Avinash Lakshmanhttps://www.youtube.com/watch?v=0hNJmb77GWg&feature=youtu.beCstar open sourced by Spotifyhttps://github.com/spotify/cstarCNCF to host OpenMetricshttps://www.cncf.io/blog/2018/08/10/cncf-to-host-openmetrics-in-the-sandboxShowdown: MySQL 8 vs PostgreSQL 10https://hackernoon.com/showdown-mysql-8-vs-postgresql-10-3fe23be5c19eWebinar (+Slides) de Percona sur MySQL 8 vs MariaDB 10.3https://www.percona.com/resources/technical-presentations/mariadb-103-vs-mysql-80-percona-technical-webinarTimescaleDB vs. InfluxDB: purpose built differently for time-series datahttps://blog.timescale.com/timescaledb-vs-influxdb-for-time-series-data-timescale-influx-sql-nosql-36489299877 Redis Labs / Apache + Commons Clause: https://redislabs.com/community/commons-clause/Redis will remain BSD licensed - http://antirez.com/news/120Redis is not “open core” : http://antirez.com/news/121It’s time for the OSS community to get real - https://www.influxdata.com/blog/its-time-for-the-open-source-community-to-get-real/-----------------------------Kafka landIntroducing Confluent Platform 5.0https://www.confluent.io/blog/introducing-confluent-platform-5-0/ Apache Kafka 2.0https://www.apache.org/dist/kafka/2.0.0/RELEASE_NOTES.html Kafka tutorial #10 - KSQLhttp://aseigneurin.github.io/2018/08/22/kafka-tutorial-10-ksql.html-----------------------------Data scienceBeyond Interactive: Notebook Innovation at Netflixhttps://medium.com/netflix-techblog/notebook-innovation-591ee3221233Deep Beers: Playing with Deep Recommendation Engines Using Kerashttps://medium.com/data-from-the-trenches/deep-beers-playing-with-deep-recommendation-engines-using-keras-part-1-1efc4779568fLight on Math Machine Learning: Intuitive Guide to Convolution Neural Networkshttps://towardsdatascience.com/light-on-math-machine-learning-intuitive-guide-to-convolution-neural-networks-e3f054dd5daaEverything you need to know about AutoML and Neural Architecture Searchhttps://towardsdatascience.com/everything-you-need-to-know-about-automl-and-neural-architecture-search-8db1863682bf-----------------------------Lisez le blog d'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdejaNicolas : https://twitter.com/nsteinmetz - https://www.cerenit.fr/ Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
31-8-2018 • 1 uur, 20 minuten, 6 seconden
Episode 58 : Data-Astro-Science
DatabaseFoundationDB, a very interesting NoSQL database owned by Apple, is now an open-source projecthttps://www.geekwire.com/2018/foundationdb-interesting-nosql-database-owned-apple-now-open-source-project/https://www.foundationdb.org/blog/foundationdb-is-open-source/Anna: A KVS for any scalehttps://blog.acolyer.org/2018/03/27/anna-a-kvs-for-any-scale/DataStax Enterprise 6.0https://docs.datastax.com/en/dse/6.0/dse-admin/datastax_enterprise/newFeatures.htmlMonitorer l’inconnu, 1000 * 100 series par jour (Quentin Adam DevoxxFR)https://www.youtube.com/watch?v=74LI4yqcI0g-----------------------------Data (astro) ScienceLes prochaines découvertes d’astronomie sont probablement cachées dans les vieilles observationshttps://medium.com/popular-science/astronomys-next-big-discovery-is-probably-hiding-in-piles-of-old-data-66c67d8755fePremières images du satelite TESS https://www.sciencesetavenir.fr/espace/univers/premiere-image-du-satellite-tess-200-000-etoiles-en-un-seul-cliche_124231Akka stream pour la recherche d'exoplanete Akka stream de 0 à 1 (E. Feller)https://www.youtube.com/watch?v=6b2NIr128a0Litterate Programming le roman de votre programme (R. Lemaire - Quickie DevoxxFR)https://www.youtube.com/watch?v=Et-19gh2C5A-----------------------------CloudArchitecture banque NuBank https://www.infoq.com/presentations/nubank-architectureAu delà des brokers un tour de l’environnement Kafka (F. Ramière DevoxxFR)https://www.youtube.com/watch?v=BBo-rqmhpDMCask is joining Google Cloudhttp://blog.cask.co/2018/05/cask-is-joining-google-cloud/-----------------------------Lisez le blog d'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdejaEmmanuel Feller : https://twitter.com/moyowi Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
24-6-2018 • 53 minuten, 34 seconden
Episode 57 : C'est comme prévoir que t'auras pas de succès !
Troll of the week : Patrick McFadinhttps://twitter.com/PatrickMcFadin/status/984467651752841219?s=20"Most everyone doing something at scale is probably using #cassandra" Oh. Except for @EpicGames and @FortniteGame They went with MongoDB.Here's the postmortem: https://www.epicgames.com/fortnite/en-US/news/postmortem-of-service-outage-at-3-4m-ccuAerospike 3.99.0.3https://jepsen.io/analyses/aerospike-3-99-0-3Effectively-once semantics in Apache Pulsarhttps://streaml.io/blog/pulsar-effectively-once/Introducing Pulsar Functionshttps://streaml.io/blog/pulsar-functions/Leaving the Nest: Heron donated to Apache Software Foundationhttps://blog.twitter.com/engineering/en_us/topics/open-source/2018/heron-donated-to-apache-software-foundation.htmlReal-Time Analytics with PGSQLhttps://blog.algolia.com/building-real-time-analytics-apis/Streaming et latence Kafkahttp://blog.ippon.fr/2018/04/09/latence_kafka/Le CEO d’horton pas convaincu par le cloud pour la data analytics https://siliconangle.com/blog/2018/03/23/elephant-room-hortonworks-ceo-thinks-hadoop-software-will-keep-driving-big-data/Métriques et Logs sur Apache Sparkhttp://blog.ippon.fr/2018/04/05/metriques-et-logs-sur-apache-spark/Gouvernance de la data par Quantmetryhttps://www.quantmetry.com/single-post/2018/04/11/La-gouvernance-de-la-data-cette-aventure-humaineInstaller un cluster coakroach + sortie de coakroach v2https://www.scaleway.com/docs/how-to-configure-a-cockroachdb-cluster/https://www.cockroachlabs.com/docs/releases/v2.0.0.htmlLe RGPD expliqué ligne par ligne https://www.nextinpact.com/news/106135-le-rgpd-explique-ligne-par-ligne-articles-1-a-23.htmGoogle Cloud Summit Paris le 5 juin 2018Venez voir Affini-tech sur son stand : http://bit.ly/gcpsummitparis2018Lisez le blog d'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdejaLucien : https://twitter.com/lulufrego Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
19-4-2018 • 1 uur, 27 minuten, 21 seconden
Episode 56 : Cambridge apocalyptica
Cambridge Analytica & Facebookhttps://www.theguardian.com/uk-news/video/2018/mar/17/cambridge-analytica-whistleblower-we-spent-1m-harvesting-millions-of-facebook-profiles-videohttps://mobile.nytimes.com/2018/03/19/technology/facebook-cambridge-analytica-explained.html?smid=tw-nytimes&smtyp=cur&referer=https://t.co/GXvVFC4fLK?amp=1https://amp.theguardian.com/news/2018/mar/17/cambridge-analytica-facebook-influence-us-election?CMP=share_btn_tw&__twitter_impression=truehttps://www.wired.com/story/the-cambridge-analytica-data-apocalypse-was-predicted-in-2007/?utm_campaign=Data%2BElixir&utm_medium=email&utm_source=Data_Elixir_175https://archive.nytimes.com/www.nytimes.com/external/readwriteweb/2010/01/10/10readwriteweb-facebooks-zuckerberg-says-the-age-of-privac-82963.htmlArrêt sur images — Cambridge Analytica : "Les données personnelles, c’est une photo de vous à poil" (💶 payant)https://beta.arretsurimages.net/emissions/cambridge-analytica-les-donnees-personnelles-cest-une-photo-de-vous-a-poilRetour sur le scandale Cambridge Analytica et la (molle) réponse de Facebook (💶 payant)https://www.nextinpact.com/news/106349-retour-sur-scandale-cambridge-analytica-et-molle-reponse-facebook.htm?skipua=1Zuckerberg has sold more Facebook stock in the last 3 months than any insider at any other company https://finance.yahoo.com/m/6ecf6e11-8682-3fb0-a852-d2d61a38f908/ss_zuckerberg-has-sold-more.html?soc_src=social-sh&soc_trk=fbOn en avait parlé dans l’épisode 38 le 3 mars 2017 ! https://www.spreaker.com/user/vhe74/bigdatahebdoep38 https://scout.ai/story/the-rise-of-the-weaponized-ai-propaganda-machineC’est expliqué sur le youtube de Cambridge Analytica depuis deux anshttps://youtu.be/c_SlD7D_xughttps://youtu.be/lBgHrn-TrD8Exploitation de nos données : quand le sage pointe le problème, l'idiot ne regarde que Facebook (💶 payant)https://www.nextinpact.com/news/106078-exploitation-nos-donnees-quand-sage-pointe-probleme-idiot-ne-regarde-que-facebook.htmDonnées personnelles : SFR, ou l’art de maquiller le recueil du consentement (💶 payant)https://www.nextinpact.com/news/106365-donnees-personnelles-sfr-ou-lart-maquiller-recueil-consentement.htmOrange et les données privéesCollision mortelle d'un piéton par une voiture autonome Uberhttps://www.sciencesetavenir.fr/high-tech/transports/accident-mortel-entre-un-pieton-et-une-voiture-autonome-uber-la-police-publie-la-video_122190http://www.01net.com/actualites/accident-mortel-waymo-charge-uber-et-indique-que-sa-voiture-autonome-aurait-evite-le-pieton-1404616.htmlEverything about Self Driving Cars Explained for Non-Engineershttps://medium.com/swlh/everything-about-self-driving-cars-explained-for-non-engineers-f73997dcb60cDistributed Data Show Episode 35: Apache Cassandra vs. the Cloud Databases with Jonathan Ellishttps://www.youtube.com/watch?v=JX9A85jKPag&t=0s&list=WL&index=5Open-sourcing a 10x reduction in Apache Cassandra tail latencyhttps://engineering.instagram.com/open-sourcing-a-10x-reduction-in-apache-cassandra-tail-latency-d64f86b43589Using Spark on Kubernetes Engine to Process Data in BigQueryhttps://cloud.google.com/solutions/spark-on-kubernetes-engineDatascienceExplained Simply: How an AI program mastered the ancient game of Gohttps://medium.freecodecamp.org/explained-simply-how-an-ai-program-mastered-the-ancient-game-of-go-62b8940a9080Mastering the game of Go with deep neural networks and tree searchhttps://storage.googleapis.com/deepmind-media/alphago/AlphaGoNaturePaper.pdfQue doit-on attendre d’un outil de gouvernance des données ?http://blog.ippon.fr/2018/03/05/que-doit-on-attendre-dun-outil-de-gouvernance-des-donnees/Corrélation n'égale pas causalité !!!!https://twitter.com/search?q=decathlon+cravachehttps://www.youtube.com/watch?v=4EWKAoKGAyg (La statistique expliquée à mon chat - Tu bois du light ? T’es foutu !)Le Moment Meurice, au salon du Big Datahttps://www.youtube.com/watch?v=rSiZPogEmTEConférences17-19 avril Devoxx France http://devoxx.fr/Lisez le blog d'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
4-4-2018 • 1 uur, 43 minuten, 5 seconden
Episode 55 : News
Building Reliable Reprocessing and Dead Letter Queues with Kafkahttps://eng.uber.com/reliable-reprocessing/Data Lineage sur Apache Spark avec Splinehttp://blog.ippon.fr/2018/02/19/data-lineage-spark-avec-spline/Elastic - Doubling Down on Openhttps://www.elastic.co/blog/doubling-down-on-openhttps://www.elastic.co/products/x-pack/openJupyterLab is Ready for Usershttps://blog.jupyter.org/jupyterlab-is-ready-for-users-5a6f039b8906Cherami: Uber Engineering’s Durable and Scalable Task Queue in Gohttps://eng.uber.com/cherami/Streams in and out of Pravegahttp://blog.pravega.io/2018/02/12/streams-in-and-out-of-pravega/http://pravega.io/Migrating Batch ETL to Stream Processing: A Netflix Case Study with Kafka and Flinkhttps://www.infoq.com/articles/netflix-migrating-stream-processingMachine Learning pour les grand-mèreshttps://www.saagie.com/fr/blog/machine-learning-pour-les-grand-meresAUTOMATED ML : IS IT THE END OF THE SEXIEST JOB OF THE 21ST CENTURY ?http://blog.xebia.fr/2018/02/20/automated-machine-learning-is-it-the-end-of-the-sexiest-job-of-the-21st-century/Google Cloud Auto MLhttps://cloud.google.com/automl/Apache MXNet - A flexible and efficient library for deep learning.http://mxnet.incubator.apache.org/Confluent and Apache Kafka in 2017https://www.confluent.io/blog/confluent-apache-kafka-2017/Oracle : l’insulte faite aux DBAhttps://www.dsfc.net/infrastructure/base-de-donnees-infrastructure/oracle-insulte-faite-aux-dba/amp/Apache Cassandra 3.11.2 releasehttps://www.mail-archive.com/[email protected]/msg12075.htmlDocker Meet Cassandra. Cassandra Meet Docker.http://thelastpickle.com/blog/2018/01/23/docker-meet-cassandra.htmlAutoscaling Dataproc clusters https://blog.doit-intl.com/autoscaling-google-dataproc-clusters-21f34beaf8a3Lisez le blog d'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
5-3-2018 • 1 uur, 26 minuten, 29 seconden
Episode 54 : CockroachDB avec Julien Anguenot
Julien Anguenot d'Iland Cloud - https://www.iland.com/ - nous parle de CockroachDB - https://www.cockroachlabs.com/ - le clone open source de Cloud Spanner - https://cloud.google.com/spanner/) qu'il a mis en production en complément d'Apache Cassandra, pour des besoins internes.Julien et Alexander participeront en tant que speakers au prochain Paris Cassandra Meetup le 31 Janvier 2018 chez Deezer : https://www.meetup.com/fr-FR/Cassandra-Paris-Meetup/events/246902065/On a ouvert un Slack : bigdatahebdo.slack.cominvitation par DM @bigdatahebdo ou sur [email protected] le blog D'affini-Techhttp://blog.affini-tech.com----------------------------------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja & http://thelastpickle.com/blogJulien : https://twitter.com/anguenotCette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
22-1-2018 • 1 uur, 13 minuten, 35 seconden
Episode 53 : 2017 review
Metrics : 10500 écoutes en 2017 (moyenne à 617 écoutes)17 episodes en 2017 (vs 14 en 2016, et 10 en 2015)Top 2017 : Episode 38 : SQL is back (Spanner / CockroachDB)Episode 42 : GDPR dans la pratiqueEpisode 37 : La bourse ou MongoDBEpisode 43 : DevoxxFr, Kafka, AWS, Microsoft CosmosDB, AMLEpisode 36 : AI ApocalypseTop overall : Episode 35 : Microsoft U-SQL avec Michel CaradecEpisode 28 : Quelques news de rentréeEpisode 38 : SQL is backEpisode 42 : GDPR dans la pratiqueEpisode 37 : La bourse ou MongoDBLes mots les plus cités dans les show notes : Apache25Kafka25Google17Cloud13Spark9Azure6Summit5Hadoop5Spanner4Cassandra4MongoDB4Beam4Confluent4Sélection de l’année 2017 (Vincent) : KafkaBeam Spanner / CockroachDBGoogle Cloud Redis (Episode 41 avec Damien Krotkine)Sélection de l’année 2017 (Alexander) : MongoDB 3.4 passes JepsenThe Rise of the Weaponized AI Propaganda MachineThe Continued Rise of Apache KafkaDeep learning (pas) pour tout le mondeGDPRMicrosoft (et CosmosDB)Lisez le blog d'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
13-1-2018 • 1 uur, 2 minuten
Episode 52 : Cosmos speaks Cassandra
Reaper 1.0 Has Been Released!http://thelastpickle.com/blog/2017/11/14/reaper-10-announcement.htmlDear Cassandra Developers, welcome to Azure #CosmosDB!https://azure.microsoft.com/en-us/blog/dear-cassandra-developers-welcome-to-azure-cosmosdb/https://venturebeat.com/2017/11/15/microsoft-updates-cosmos-db-with-cassandra-support-better-availability-guarantees/Introducing Azure Databrickshttps://databricks.com/blog/2017/11/15/introducing-azure-databricks.html?utm_content=63154906&utm_medium=social&utm_source=twitterGoogle Cloud Spanner goes multi-regionhttp://www.zdnet.com/article/google-cloud-spanner-goes-multi-region/Transactions in Apache Kafkahttps://www.confluent.io/blog/transactions-apache-kafka/KSQL Developer Preview november updatehttps://www.confluent.io/blog/november-update-ksql-developer-preview-available/Looking Ahead to Apache Flink 1.4.0 and 1.5.0https://data-artisans.com/blog/looking-ahead-apache-flink-1-4-1-5Elasticsearch 6.0: not that new, but quite improvedhttp://www.zdnet.com/article/elasticsearch-6-0-not-that-new-but-quite-improved/À la rencontre des « raters », petites mains des « big data »http://theconversation.com/a-la-rencontre-des-raters-petites-mains-des-big-data-86484http://books.openedition.org/cdf/5013The Washington Post Is A Software Company Nowhttps://www.fastcompany.com/40495770/the-washington-post-is-a-software-company-nowDevoxx 2017https://www.youtube.com/playlist?list=PLRsbF2sD7JVqZ4RpHYkqSuCNhxumGP5eoLisez le blog D'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja
15-12-2017 • 1 uur, 12 minuten, 15 seconden
Episode 51 : Apache Beam avec Jean-Baptiste Onofré
http://beam.incubator.apache.org/Vous pouvez retouver Jean-Baptiste :http://blog.nanthrax.net/https://github.com/jbonofrehttps://twitter.com/jbonofre https://www.linkedin.com/in/jean-baptiste-onofr%C3%A9-a0739317Lisez le blog D'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
18-11-2017 • 1 uur, 9 minuten, 55 seconden
Episode 50 : Kafka 1.0 Java 9 et bien d'autres
KafkaApache Kafka Goes 1.0https://www.confluent.io/blog/apache-kafka-goes-1-0/Getting Started Analyzing Twitter Data in Apache Kafka through KSQLhttps://www.confluent.io/blog/using-ksql-to-analyse-query-and-transform-data-in-kafkaStories from the Front: Lessons Learned from Supporting Apache Kafkahttps://www.confluent.io/blog/stories-front-lessons-learned-supporting-apache-kafka/Apache ZooKeeper and Apache Kafka on Kubernetes StatefulSets & DaemonSetshttp://blog.kubernetes.io/2017/09/kubernetes-statefulsets-daemonsets.htmlIntro à Kubernetes http://blog.affini-tech.com/tag/kubernetes/index.htmlJavaJava 9 Release Now Available!https://blogs.oracle.com/java/java-9-release-now-availablehttps://www.oracle.com/java/java9-screencasts.htmlThe G1 GC in JDK 9https://www.youtube.com/watch?v=OhPGN2Av44E&feature=youtu.beNew Project: Z Garbage Collectorhttp://mail.openjdk.java.net/pipermail/announce/2017-October/000237.htmlGoogle Cloud PlatformExtending per second billing in Google Cloudhttps://cloudplatform.googleblog.com/2017/09/extending-per-second-billing-in-google.htmlAnnouncing Google Cloud IoT Core public beta https://cloudplatform.googleblog.com/2017/09/announcing-Cloud-IoT-Core-public-beta.htmlhttps://www.gcppodcast.com/post/episode-101-iot-core/Scheduling and sampling arrive for Google Cloud Dataprephttps://cloud.google.com/blog/big-data/2017/11/scheduling-and-sampling-arrive-for-google-cloud-dataprepCreating Custom Interactive Dashboards with Bokeh and BigQueryhttps://cloud.google.com/solutions/bokeh-and-bigquery-dashboardsGoogle Colaboratoryhttps://research.google.com/colaboratory/unregistered.htmlSparkDatabricks Delta: A Unified Data Management System for Real-time Big Datahttps://databricks.com/blog/2017/10/25/databricks-delta-a-unified-management-system-for-real-time-big-data.htmlTESTER DU CODE SPARK : 1- LA THÉORIEhttp://blog.xebia.fr/2017/01/06/tester-du-code-spark-1-la-theorie/TESTER DU CODE SPARK – 2 – LA PRATIQUEhttp://blog.xebia.fr/2017/09/19/tester-du-code-spark-2-la-pratique/Apache Spark : Utilisation des UDF et Curryinghttp://blog.affini-tech.com/apache-spark-utilisation-des-udf-et-currying/Lisez le blog D'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.com https://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
9-11-2017 • 1 uur, 4 minuten, 50 seconden
Episode 49 : En direct du Google Cloud Summit Paris
En direct du Google Cloud Summit de Paris le 19 octobre 2017 avec William Vambenepe ( https://twitter.com/vambenepe )GOOGLE CLOUD BIG DATA AND MACHINE LEARNING BLOGhttps://cloud.google.com/blog/big-data/La playlist Youtube ou vous devrez rapidement retrouver les présentations du Summithttps://www.youtube.com/user/googlecloudplatform/playlists-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Cette publication est sponsorisée par Affini-Tech http://affini-tech.com https://twitter.com/affinitech http://blog.affini-tech.comOn recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
23-10-2017 • 25 minuten, 18 seconden
Episode 48 : no views ?
Cassandra : Proposal to retroactively mark materialized views experimentalhttps://lists.apache.org/thread.html/d81a61da48e1b872d7599df4edfa8e244d34cbd591a18539f724796f@%3Cdev.cassandra.apache.org%3ECassandra pluggable storage enginehttps://lists.apache.org/thread.html/0540e793ec58eb97d8afe294635279d16e0191f9b613ad3edd710181@%3Cdev.cassandra.apache.org%3Ecouchbasehttps://www.couchbase.com/products/data-platformGoogle Cloud Dataprep - Data Handling Made Easierhttps://medium.com/google-cloud/google-cloud-dataprep-data-handling-made-easier-79d7c35fbbe7et l’épisode que nous avions enregistré sur Trifacta avec Victor Coustenoble : https://www.spreaker.com/user/vhe74/ep45-trifactaProvision on-demand Spark clusters on Docker using Azure Batch's infrastructurehttps://azure.microsoft.com/en-us/blog/on-demand-spark-clusters-on-docker/Techs.Rocks : Échangeons entre Tech Leadershttps://www.techs.rocks/Lisez le blog D'affini-Techhttp://blog.affini-tech.com-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
10-10-2017 • 38 minuten, 25 seconden
Episode 47 : Kafka, SQL, Beam and co
Exactly-once Semantics are Possible: Here’s How Kafka Does ithttps://www.confluent.io/blog/exactly-once-semantics-are-possible-heres-how-apache-kafka-does-it/?utm_content=buffer9b1b6&utm_medium=social&utm_source=twitter.com&utm_campaign=bufferhttps://blog.ippon.fr/2017/07/11/kafka-0-11-0-%E2%99%A5/Confluent KSQLhttps://www.confluent.io/blog/ksql-open-source-streaming-sql-for-apache-kafka/https://www.youtube.com/watch?v=A45uRzJiv7I&feature=youtu.beKafka + Prestodb.iohttps://prestodb.io/docs/current/connector/kafka.htmlStreaming SQL in Apache Flink, KSQL, and Stream Processing for Everyonehttps://data-artisans.com/blog/flink-streaming-sql-ksql-stream-processingKafka Wakes Up And Is Metamorphosed Into A Databasehttps://www.nextplatform.com/2017/08/30/kafka-wakes-metamorphosed-database/amp/(Editor’s Note: It would have been far funnier, of course, if Kafka woke up one morning and had been turned into CockroachDB.)Open sourcing Kafka cruise controlhttps://engineering.linkedin.com/blog/2017/08/open-sourcing-kafka-cruise-controlhttps://github.com/linkedin/cruise-controlYahoo’s New Pulsar: A Kafka Competitor?https://www.datanami.com/2016/09/07/yahoos-new-pulsar-kafka-competitor/Apache Beam 2.1https://beam.apache.org/get-started/downloads/Apache Beam splittable DoFnhttps://beam.apache.org/blog/2017/08/16/splittable-do-fn.htmlInstaclustr Dynamic Resizing for Apache Cassandrahttps://www.instaclustr.com/instaclustr-dynamic-resizing-for-apache-cassandra/?utm_content=buffer624e7&utm_medium=social&utm_source=twitter.com&utm_campaign=bufferRiak devs giddy over gambling biz's vow to set code freehttps://www.theregister.co.uk/2017/08/25/bet365_to_buy_basho_release_code/?mt=1503782778086Spark Release 2.2.0http://spark.apache.org/releases/spark-release-2-2-0.html[mooc] Specialisation Data-Engineering Google Cloud sur Courserahttps://fr.coursera.org/specializations/gcp-data-machine-learning[podcast] Y a-t-il un cerveau dans la machine ? une interview de Yann Le Cun, directeur du FAIRhttps://www.franceculture.fr/emissions/la-methode-scientifique/y-t-il-un-cerveau-dans-la-machine[podcast] DREMEL, DRUID AND DATA MODELING ON GOOGLE BIGQUERY' https://www.drilltodetail.com/podcast/2017/6/19/drill-to-detail-ep31-dremel-druid-and-data-modeling-on-google-bigquery-with-special-guest-dan-mcclary[privacy] comment les apps Figaro, L’Équipe ou Closer participent au pistage de 10 millions de Françaishttp://www.numerama.com/politique/282934-enquete-comment-les-apps-figaro-lequipe-ou-closer-participent-au-pistage-de-10-millions-de-francais.htmlComment l’intelligence artificielle bouleverse l’industrie des médiashttp://www.latribune.fr/opinions/tribunes/comment-l-intelligence-artificielle-bouleverse-l-industrie-des-medias-746917.htmlCédric Villani est chargé d'une mission d'information parlementaire sur l'IA.http://www.numerama.com/politique/286341-le-gouvernement-fait-appel-a-cedric-villani-pour-une-mission-sur-lia.html-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
8-9-2017 • 1 uur, 17 minuten, 59 seconden
Episode 46 : Elassandra
Nous recevons pour cet épisode Vincent Royer qui vient nous parler d'Elassandra dont il est le créateur. http://www.elassandra.io/https://twitter.com/elassandraioLe github du projethttps://github.com/strapdata/elassandraLa société Strapdata http://www.strapdata.comLe talk du C* Summit 2016 : "Elassandra: Elasticsearch as C* Secondary Index"https://www.youtube.com/watch?v=0WuLZTvA3YMet les slides associés : https://fr.slideshare.net/DataStax/elassandra-elasticsearch-as-a-cassandra-secondary-index-rmi-trouville-vincent-royer-independent-c-summit-2016Instaclustr propose Elassandrahttp://www.marketwired.com/press-release/instaclustr-first-to-offer-managed-service-for-elassandra-and-kibana-2217532.htmPour suivre Vincent Royer :https://twitter.com/vroyerv-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
4-9-2017 • 1 uur, 12 minuten, 56 seconden
Episode 45 : Trifacta Wrangler avec Victor Coustenoble
Victor Coustenoble nous explique aujourd'hui ce qu'est le "Data Wrangling". Trifacta est un outil de préparation de données intégré dans nos plateformes data favorites. Pour en savoir plus sur Trifacta c'est ici : https://www.trifacta.com/fr/ et là : https://www.trifacta.com/news-and-press/?language=frVous pouvez retrouver Victor sur sont twitter : https://twitter.com/vizanalytics ou sur Linkedin : https://www.linkedin.com/in/victorcoustenoble/------------------------------------------------------------- http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Edité par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
12-7-2017 • 55 minuten, 33 seconden
Episode 44 : Apachecon, et des news en vrac...
Apache BigData Retour sur Apache BigDataDataStax announces availability of ‘white glove’ managed cloud servicehttp://diginomica.com/2017/05/23/datastax-announces-availability-white-glove-managed-cloud-service/amp/CockroachDB 1.0 is Production-Readyhttps://www.cockroachlabs.com/blog/cockroachdb-1-0-release/Local and distributed query processing in CockroachDBhttps://www.cockroachlabs.com/blog/local-and-distributed-processing-in-cockroachdb/#Azure Cosmos DBhttps://speakerdeck.com/dharmashukla/azure-cosmos-db-lessons-learnt-from-building-a-globally-distributed-database-from-the-ground-uphttps://channel9.msdn.com/Events/Build/2017/KEY01#time=1h27m20shttps://softwareengineeringdaily.com/2017/06/01/cosmosdb-with-andrew-hoh/A Vision for Making Deep Learning Simplehttps://databricks.com/blog/2017/06/06/databricks-vision-simplify-large-scale-deep-learning.htmlSpark gets automation: Analyzing code and tuning clusters in productionhttp://www.zdnet.com/article/spark-gets-automation-analyzing-code-and-tuning-clusters-in-production/https://www.pepperdata.com/press-releases/pr_052317/What’s New in Hadoop 3.0 – Enhancements in Apache Hadoop 3https://www.edureka.co/blog/hadoop-3/Apache Flink® 1.3.0 and the Evolution of Stream Processing with Flinkhttps://data-artisans.com/blog/apache-flink-1-3-0-evolution-stream-processingYou are not Googlehttps://blog.bradfieldcs.com/you-are-not-google-84912cf44afbMaster time with Kibana’s new time series visual builderhttps://www.elastic.co/blog/master-time-with-kibanas-new-time-series-visual-builder?blade=twTeradata doubles downhttp://www.zdnet.com/google-amp/article/teradata-doubles-down/
9-7-2017 • 53 minuten, 42 seconden
Episode 43 : DevoxxFr, Kafka, AWS, Microsoft CosmosDB, AML
KafkaConfluent Cloud : Managed Apache Kafka par Confluenthttps://www.confluent.io/confluent-cloud/https://www.forbes.com/sites/alexkonrad/2017/05/08/confluent-brings-kafka-to-cloud-and-challenges-aws/amp/Kafka with Docker: A Docker introductionhttps://ngeor.wordpress.com/2017/03/25/kafka-with-docker-a-docker-introduction/amp/Apache Flink and Apache Kafka Streams: a comparison and guideline for usershttps://www.confluent.io/blog/apache-flink-apache-kafka-streams-comparison-guideline-users/The Continued Rise of Apache Kafkahttps://redmonk.com/fryan/2017/05/07/the-continued-rise-of-apache-kafka/Kafka Summit - Introduction to Kafka Streams with a Real-Life Example by Alexis Seigneurinhttps://speakerdeck.com/aseigneurin/kafka-summit-introduction-to-kafka-streams-with-a-real-life-exampleWebinar Boontadata avec @benjguin du 10/05/17 (replay bientôt disponible)https://aka.ms/wp-boontadataMicrosoftServing AI with data: A summary of Build 2017 data innovationshttps://blogs.technet.microsoft.com/dataplatforminsider/2017/05/10/serving-ai-with-data-a-summary-of-build-2017-data-innovations/Azure Cosmos DB: The industry’s first globally-distributed, multi-model database servicehttps://azure.microsoft.com/en-us/blog/azure-cosmos-db-microsofts-globally-distributed-multi-model-database-service/Using Jupyter notebooks and Pandas with Azure Data Lake Storehttps://medium.com/azure-data-lake/using-jupyter-notebooks-and-pandas-with-azure-data-lake-store-48737fbad305End-to-End Scenarios Enabled by the Data Science Virtual Machine: Webinar Videohttps://blogs.technet.microsoft.com/machinelearning/2017/05/02/end-to-end-scenarios-enabled-by-the-data-science-virtual-machine-video/AWSAWS now lets you migrate MongoDB databases to DynamoDBhttps://venturebeat.com/2017/04/10/aws-now-lets-you-migrate-mongodb-databases-to-dynamodb/amp/Deep Dive on Amazon EC2 Instances - January 2017 Online Tech Talkshttps://www.youtube.com/watch?v=29QZPttiKJADatascienceAutomated Machine Learning — A Paradigm Shift That Accelerates Data Scientist Productivity @ Airbnbhttps://medium.com/airbnb-engineering/automated-machine-learning-a-paradigm-shift-that-accelerates-data-scientist-productivity-airbnb-f1f8a10d61f8DiversManaged Service for Elassandra provided by Instaclustrhttps://www.instaclustr.com/blog/2017/05/09/managed-service-elassandra-provided-instaclustr/The new BigData file format for Faster Data analysishttp://carbondata.apache.org/Elasticsearch succombe au machine learninghttp://www.silicon.fr/elasticsearch-succombe-au-machine-learning-174421.htmlGDPRLa conformité un avantage compétitifhttp://www.zdnet.fr/actualites/la-conformite-un-avantage-competitif-39850544.htmPrivacy by designhttp://www.zdnet.fr/actualites/privacy-by-design-kezako-39850666.htm
15-5-2017 • 1 uur, 17 minuten, 10 seconden
Episode 42 : GDPR dans la pratique
Episode dédié au règlement européen sur les données privées ( GDPR ) avec la contribution de Jean-Louis Quéguiner que vous pouvez suivre sur Linkedin ( https://www.linkedin.com/in/jlqueguiner ).Jean-Louis est le CTO de Auchan Retail Data, et est donc confronté au quotidien au sujet GDPR. La feuille de route en 6 étapes de la CNIL : https://www.cnil.fr/fr/principes-cles/reglement-europeen-se-preparer-en-6-etapes-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Edité par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
7-5-2017 • 57 minuten, 31 seconden
Episode 41 : Redis avec Damien Krotkine
Episode dédié à la base Redis ( https://redis.io/ ) avec la contribution de Damien Krotkine que vous pouvez suivre sur Twitter ( https://twitter.com/damsieboy ) ou sur son blog ( http://damien.krotkine.com/ )Damien travaille chez Booking.com ( https://www.booking.com ). Ils seront présent le 24 Avril à dotscale.io ( https://www.dotscale.io/partner/booking.com ) et lors d'un Meetup à la suite de l'événement. -------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Edité par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
7-4-2017 • 1 uur, 10 minuten, 3 seconden
Episode 40 : Boontadata avec Benjamin Guinebertière
Le projet Boontadata vise à étudier les architectures de traitement de stream en fournissant des outils pour tester les différentes options disponibles sur le marché. Le blog de Boontadata est ici : https://boontadata.github.io/et les git sont ici : https://github.com/boontadataCe projet a été créé et est maintenu par Benjamin Guinebertière que vous pouvez retrouver sur twitter http://twitter.com/benjguin, ou sinon sur http://3-4.fr -------------------------------------------------------------Cet épisode a été enregistré avec le support de Microsoft France-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Edité par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
5-4-2017 • 48 minuten, 10 seconden
Episode 39 : Quelques News, Kafka, Hoodie, Google Next, ScillaDB, IA, GDPR
Confluent raises $50M to continue growing commercial arm of Apache Kafkahttps://techcrunch.com/2017/03/07/confluent-raises-50m-to-continue-growing-commercial-arm-of-apache-kafka/How Kafka Redefined Data Processing for the Streaming Agehttps://www.datanami.com/2017/03/07/kafka-redefined-data-processing-streaming-age/Hoodie: Uber Engineering’s Incremental Processing Framework on Hadoophttps://eng.uber.com/hoodie/Analysis: It’s Amazon Web Services’ world – Google Cloud is just living in ithttp://siliconangle.com/blog/2017/03/08/analysis-amazon-web-services-world-google-cloud-just-living/Welcome Kaggle to Google Cloudhttps://cloudplatform.googleblog.com/2017/03/welcome-Kaggle-to-Google-Cloud.htmlGoogle Next 17https://blog.google/topics/google-cloud/100-announcements-google-cloud-next-17/Google Cloud Dataprephttps://cloud.google.com/blog/big-data/2017/03/google-cloud-platform-adds-new-tools-for-easy-data-preparation-and-integrationPython SDK released in Apache Beam 0.6.0https://beam.apache.org/blog/2017/03/16/python-sdk-release.htmlScyllaDB Raises $16M to Advance NoSQL Database Technologyhttp://www.enterpriseappstoday.com/data-management/scylladb-raises-16m-to-advance-nosql-database-technology.htmlHadoop Has Failed Us, Tech Experts Sayhttps://www.datanami.com/2017/03/13/hadoop-failed-us-tech-experts-say/Impact de l'Intelligence Artificielle sur l'économie - Laurent ALEXANDRE au Senathttps://www.youtube.com/watch?v=rJowm24piM4&feature=youtu.beGDPR General Data Protection Regulationhttp://www.cil.cnrs.fr/CIL/spip.php?article2634https://en.wikipedia.org/wiki/General_Data_Protection_RegulationEvents Le programme Devoxx France est publiéhttp://cfp.devoxx.fr/2017/byday/wed-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
25-3-2017 • 1 uur, 18 minuten, 23 seconden
Episode 38 : SQL is back
SpannerSpanner, the Google Database That Mastered Time, Is Now Open to Everyonehttps://www.wired.com/2017/02/spanner-google-database-harnessed-time-now-open-everyone/Google Spanner Inspires CockroachDB To Outrun Ithttps://www.nextplatform.com/2017/02/22/google-spanner-inspires-cockroachdb-outrun/Spanner, TrueTime and the CAP Theoremhttps://research.google.com/pubs/pub45855.htmlSpanner quickstarthttps://cloud.google.com/spanner/docs/quickstart-console-------------------------------------------------------------DBThe probability of data loss in large clustershttp://martin.kleppmann.com/2017/01/26/data-loss-in-large-clusters.htmlThe first release candidate of Redis 4.0 is outhttp://antirez.com/news/110MongoDB 3.4 Passes Jepsen – The Industry’s Toughest Database Testhttps://www.mongodb.com/mongodb-3.4-passes-jepsen-testhttp://jepsen.io/analyses/mongodb-3-4-0-rc3-------------------------------------------------------------Data-science10 Signs Of A Bad Data Scientisthttp://www.kdnuggets.com/2016/04/10-signs-bad-data-scientist.htmlThe Rise of the Weaponized AI Propaganda Machinehttps://medium.com/join-scout/the-rise-of-the-weaponized-ai-propaganda-machine-86dac61668b#.qvwftlojyAnnouncing TensorFlow 1.0https://developers.googleblog.com/2017/02/announcing-tensorflow-10.htmlLearn TensorFlow and deep learning, without a Ph.D.https://cloud.google.com/blog/big-data/2017/01/learn-tensorflow-and-deep-learning-without-a-phd-------------------------------------------------------------DiversProjets Hadoop : un échec dans 70 % des cashttp://www.silicon.fr/projets-hadoop-echec-70-cas-169110.htmlMedia recap of the Apache Beam graduationhttps://beam.apache.org/blog/2017/02/01/graduation-media-recap.htmlhttps://beam.apache.org/documentation/runners/capability-matrix/#cap-summary-whatSpark Summit East 2017 - A summaryhttp://blog.ippon.tech/spark-summit-east-2017-a-summary/https://spark-summit.org/east-2017/schedule/Joue la comme Clever Cloud : comment nous avons survécu à un redressement judiciairehttps://medium.com/@waxzce/joue-la-comme-clever-cloud-comment-nous-avons-surv%C3%A9cu-%C3%A0-un-redressement-judiciaire-68a4b79c902#.s1g9bha19-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
3-3-2017 • 1 uur, 17 minuten, 25 seconden
Episode 37 : La bourse ou MongoDB
8 data trends on our radar for 2017https://www.oreilly.com/ideas/8-data-trends-on-our-radar-for-2017The Rise of the Data Engineerhttps://medium.com/@maximebeauchemin/the-rise-of-the-data-engineer-91be18f1e603#.8me3508a4Palantir et la France : naissance d’une nouvelle théorie abracadabrantesque ?https://reflets.info/palantir-et-la-france-naissance-dune-nouvelle-theorie-abracadabrantesque/http://www.silicon.fr/big-data-la-dgsi-se-rapproche-de-palantir-161283.htmlhttp://www.parismatch.com/Actu/International/La-CIA-appelee-au-secours-par-l-antiterrorisme-francais-1138268Qu’est-ce que le Data Lake, le nouveau concept "Big Data" en vogue http://www.journaldunet.com/solutions/dsi/1165409-qu-est-ce-que-le-datalake-le-nouveau-concept-big-data-en-vogue/You Can Now Play with Stack Overflow Data on Google’s BigQueryhttp://stackoverflow.blog/2016/12/You-Can-Now-Play-With-Stack-Overflow-Data-on-Googles-BigQuery/https://cloud.google.com/bigquery/public-data/stackoverflowSparkDatabricks Raises $60 Million in Series C Funding to Advance Data Science and Engineering at Scalehttp://m.marketwired.com/press-release/databricks-raises-60-million-series-c-funding-advance-data-science-engineering-scale-2183541.htmIntroducing Apache Spark 2.1https://databricks.com/blog/2016/12/29/introducing-apache-spark-2-1.htmlTop 10 Apache Spark blog posts from 2016https://databricks.com/blog/2016/12/30/top-10-apache-spark-blog-posts-from-2016.htmlNoSQLMongoDB Apocalypse Is Here as Ransom Attacks Hit 10,000 Servershttps://www.bleepingcomputer.com/news/security/mongodb-apocalypse-is-here-as-ransom-attacks-hit-10-000-servers/https://www.bleepingcomputer.com/news/security/a-benevolent-hacker-is-warning-owners-of-unsecured-cassandra-databases/RethinkDB: why we failedhttp://www.defstartup.org/2017/01/18/why-rethinkdb-failed.htmlRethinkDB is dead, and MongoDB isn't what killed ithttp://www.techrepublic.com/article/rethinkdb-is-dead-and-mongodb-isnt-what-killed-it/Tuning Java Driver for Heavy write and Low Latency Read Scenariohttps://www.smartcat.io/blog/2016/tuning-java-driver-for-heavy-write-and-low-latency-read-scenario/TWCS part 1 - how does it work and when should you use it ?http://thelastpickle.com/blog/2016/12/08/TWCS-part1.htmlData-Science Learn TensorFlow and deep learning, without a Ph.D.https://cloud.google.com/blog/big-data/2017/01/learn-tensorflow-and-deep-learning-without-a-phd.htmlBig deep learning news: Google Tensorflow chooses Kerashttp://www.fast.ai/2017/01/03/keras/-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
28-1-2017 • 1 uur, 9 minuten, 14 seconden
Episode 36 : AI Apocalypse
Pour ce premier épisode de 2017, un gros focus sur l'IA et ses enjeux :The Great A.I. Awakeninghttp://mobile.nytimes.com/2016/12/14/magazine/the-great-ai-awakening.htmlUne I.A. remplace 34 employés d’une assurance au Japonhttp://www.numerama.com/tech/221747-une-i-a-remplace-34-employes-dune-assurance-au-japon.htmlLemonade Sets New World Record https://medium.com/@dschreiber/lemonade-sets-new-world-record-706ef8674110#.ze3xl0y97Washington s’inquiète des conséquences de l’IA sur le monde du travailhttp://www.numerama.com/politique/219002-washington-sinquiete-des-consequences-de-lia-sur-le-monde-du-travail.html3 000 véhicules autonomes remplaceraient tous les taxis de New Yorkhttp://www.silicon.fr/3000-vehicules-autonomes-remplacer-taxis-new-york-166432.htmlTesla autopilot predicts crashhttps://www.engadget.com/2016/12/28/tesla-autopilot-predicts-crash/Amazon’s Real Future Isn’t Drones. It’s Self-Driving Truckshttps://www.wired.com/2016/12/amazons-real-future-isnt-drones-self-driving-trucks/Big data and analytics trends in 2017: James Kobielus’s predictionshttp://www.ibmbigdatahub.com/blog/big-data-and-analytics-trends-2017-james-kobielus-s-predictionsAI IS DISRUPTING EVERYTHING AND THESE 3 INDUSTRIES ARE NEXThttp://dataconomy.com/2016/11/artificial-intelligence-retail-healthcare-finance/?mc_cid=92cb38938d&mc_eid=74c41363d6Self-learning software that builds itselfhttps://gcn.com/blogs/emerging-tech/2016/11/runtime-emergent-software.aspx?admgarea=TC_EmergingTechMachine Learning is Fun Part 6: How to do Speech Recognition with Deep Learninghttps://medium.com/@ageitgey/machine-learning-is-fun-part-6-how-to-do-speech-recognition-with-deep-learning-28293c162f7a#.es1ocew0hUn drapeau rouge pour l’Intelligence Artificielle ?http://blog.equancy.com/un-drapeau-rouge-pour-lintelligence-artificielle/-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent : https://twitter.com/vhe74Alexander : https://twitter.com/alexanderdeja Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com https://twitter.com/affinitech )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
16-1-2017 • 1 uur, 17 minuten, 24 seconden
Episode 35 : Microsoft U-SQL avec Michel Caradec
Nous avons le plaisir de recevoir dans cet épisode Michel Caradec : Project Manager, Software & Data Engineer at CegidResponsable technique chez Cegid, éditeur de logiciels de gestion.En charge du développement des solutions décisionnelles et fiscales.Expert des technologies associées au traitement des données (moteurs de transformation, OLAP, architectures distribuées).Travaille sur les problématiques liées au Big Data et Machine Learning.Portfolio :Github : https://github.com/michelcaradec/RPubs : http://rpubs.com/mcaradecShiny : https://mcaradec.shinyapps.io/runrshiny/SlideShare : http://www.slideshare.net/mcaradec/Contributeur sur Data-Bzh (http://data-bzh.fr/), blog dédié à l’Open Data en Bretagne.Nous avons parlé de : Azure Datalake : https://azure.microsoft.com/fr-fr/solutions/data-lake/U-SQL : https://azure.microsoft.com/fr-fr/resources/videos/data-lake-u-sql-query-execution/Les slides du talk que Michel avait fait lors du Paris Datageeks : http://www.slideshare.net/mcaradec/paris-dldatageeks-meetup-05102016/-------------------------------------------------------------http://www.bigdatahebdo.comhttps://twitter.com/bigdatahebdoVincent Heuschling : https://twitter.com/vhe74Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com )On recrute ! venez cruncher de la data avec nous ! écrivez nous à [email protected]
8-12-2016 • 1 uur, 6 minuten, 47 seconden
Episode 34 : Serverless Monster
Amazon goes all in on AI and Big Data at AWS:Reinvent 2016http://www.techrepublic.com/article/amazon-goes-all-in-on-ai-and-big-data-at-aws-reinvent-2016/AWS EC2 Instances Updateshttps://aws.amazon.com/fr/blogs/aws/ec2-instance-type-update-t2-r4-f1-elastic-gpus-i3-c5Custom silicon, 9PB storage boxes, and 25Gb Ethernet – just another day in AWS hardwarehttp://www.theregister.co.uk/2016/11/30/aws_hardware/Amazon Athenahttps://aws.amazon.com/fr/athena/https://aws.amazon.com/fr/athena/pricing/https://prestodb.io/Run IoT applications seamlessly across the AWS cloud and local deviceshttps://aws.amazon.com/fr/greengrass/How GCP is challenging AWShttps://stratechery.com/2016/how-google-cloud-platform-is-challenging-aws/Five Reasons Why The Amazon Cloud Has Lost Its Silver Lininghttp://www.forbes.com/sites/jasonbloomberg/2016/11/27/five-reasons-why-the-amazon-cloud-has-lost-its-silver-lining/#6a7edcdeed1fStream Processing Myths Debunkedhttp://data-artisans.com/stream-processing-myths-debunked/Debeziumhttp://debezium.io/docs/A critique of the CAP theoremhttp://jvns.ca/blog/2016/11/19/a-critique-of-the-cap-theorem/-------------------------------------------------------------http://www.bigdatahebdo.comPour nous suivre : Alexander : https://twitter.com/alexanderdeja Vincent : https://twitter.com/vhe74Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com )
2-12-2016 • 57 minuten, 14 seconden
Episode 33 : des news venues du Cloud...
Datastax acquires DataScale and announces Datastax Managed Cloudhttp://www.datastax.com/2016/11/announcing-datastax-managed-cloudMicrosoft's data announcements, and what they meanhttp://www.zdnet.com/article/microsofts-data-announcements-and-what-they-mean/Announcing GPUs for Google Cloud Platform https://cloudplatform.googleblog.com/2016/11/announcing-GPUs-for-Google-Cloud-Platform.htmlRetour sur le Spark Summit Europe 2016http://blog.ippon.fr/2016/11/08/retour-sur-le-spark-summit-europe-2016/https://www.youtube.com/user/TheApacheSpark/playlistsApache Spark: Config Cheatsheethttp://c2fo.io/c2fo/spark/aws/emr/2016/07/06/apache-spark-config-cheatsheet//Hortonworks comes to the Amazon AWS cloudhttp://www.zdnet.com/article/hortonworks-comes-to-the-amazon-aws-cloud/OLAP for Big Data on Hadoophttps://dzone.com/articles/olap-for-big-dataDBAs of the futurehttp://www.dbms2.com/2016/11/23/dbas-of-the-future/CFP DevoxxFR ouvert jusqu’au 8 janvier !https://cfp.devoxx.fr/-------------------------------------------------------------Pour nous retrouver : Alexander : https://twitter.com/alexanderdeja & Vincent : https://twitter.com/vhe74Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com )
25-11-2016 • 1 uur, 11 seconden
Episode 32 : Spark streaming avec Alexis Seigneurin
Alexis nous fait part de son expérience autour de Spark streaming et de la mise en production de pipelines de data-science. La présentation dont on parle est ici : https://www.youtube.com/watch?v=ps8JIqt1QJAles slides sont là : https://speakerdeck.com/aseigneurin/lessons-learned-using-spark-and-microservicesLa nouvelle plateforme "DataMC" de IPPON est là : http://datamc.io et là https://twitter.com/datamcioOn retrouve Alexis sur son tweeter ( https://twitter.com/aseigneurin ) et son blog ( http://aseigneurin.github.io )-----------------------------------Pour me retrouver c'est ici https://twitter.com/vhe74Cette publication est sponsorisée par Affini-Tech ( http://affini-tech.com )
11-11-2016 • 57 minuten, 13 seconden
Episode 31 : Quelques news, et la relation Datastax / Cassandra
Datastax vs Apache Software Foundationhttp://sdtimes.com/apache-foundation-board-reining-datastax/http://www.datastax.com/2016/11/serving-customers-serving-the-communityTeradata MPP on AWS et Teradata (re)embarks on a solutions journeyhttp://www.vldbsolutions.com/blog/teradata-mpp-aws/http://www.zdnet.com/article/teradata-reembarks-on-a-solutions-journey/#ftag=RSSbaffb68Pricing : https://aws.amazon.com/marketplace/pp/B01LW1R13TAnnouncing the dA Platform, our distribution of Apache® Flink®http://data-artisans.com/announcing-the-da-platform-our-distribution-of-apache-flink/Unifying Stream Processing and Interactive Queries in Apache Kafkahttp://www.confluent.io/blog/unifying-stream-processing-and-interactive-queries-in-apache-kafka/Apache Kafka: Online Talk Serieshttp://www.confluent.io/apache-kafka-talk-seriesBoontadata streamshttps://github.com/boontadata/boontadata-streamsComparing ORC vs Parquet Data Storage Formats using Hivehttp://www.thecloudavenue.com/2016/10/comparing-orc-vs-parquet-data-storage.htmlWHERE IS APACHE HIVE GOING? TO IN-MEMORY COMPUTINGhttp://fr.hortonworks.com/blog/apache-hive-going-memory-computing/http://hortonworks.com/blog/announcing-apache-hive-2-1-25x-faster-queries-much/Palantir Sued By Department of Labor For Race Discriminationhttp://gizmodo.com/palantir-sued-by-department-of-labor-for-race-discrimin-1787103451/ampMongoDB 3.4 : nouvelles fonctionnalitéshttp://www.zdnet.com/article/mongodb-3-4-fills-some-enterprise-database-gaps/Simba Drivers for Google BigQueryhttps://cloud.google.com/bigquery/partners/simba-drivers/How Bayesian Inference WorksBayesian inference is a way to get sharper predictions from your data.http://www.datasciencecentral.com/profiles/blogs/how-bayesian-inference-worksAnnouncing RStudio v1.0!https://blog.rstudio.org/2016/11/01/announcing-rstudio-v1-0/Classifying handwritten digits using TensorFlowhttp://blog.yhat.com/posts/handwriting-classifier-updated.htmlTraffic in London episode I: processing 100 billion IoT eventshttp://blog.datatonic.com/2016/10/traffic-in-london-episode-i-live.htmlhttps://code.visualstudio.com/
7-11-2016 • 1 uur, 12 minuten, 15 seconden
Episode 30 : Clever Cloud avec Quentin Adam
Clever Cloud et la data présenté par son CEO Quentin Adam. http://www.clever-cloud.com/Sinon pour retrouver Quentin c'est par ici : https://twitter.com/waxzcehttps://github.com/waxzcehttps://speakerdeck.com/waxzce
28-10-2016 • 47 minuten, 15 seconden
Episode 29 : Apache Beam avec Jean-Baptiste Onofré
Un épisode qu'on a mis beaucoup de temps à sortir, et qui souffre d'une mauvaise qualité sonore, désolé. Le manque de bande passante est clairement l'ennemi du podcast. http://beam.incubator.apache.org/Vous pouvez retouver Jean-Baptiste :http://blog.nanthrax.net/https://github.com/jbonofrehttps://twitter.com/jbonofre https://www.linkedin.com/in/jean-baptiste-onofr%C3%A9-a0739317
24-10-2016 • 1 uur, 3 minuten, 2 seconden
Episode 28 : Quelques news de rentrée
Jonathan Ellis quitte le poste de chairman du projet Apache Cassandra http://www.datastax.com/2016/08/a-look-back-a-look-forwardApple rachète TupleJumphttp://www.macg.co/aapl/2016/09/apple-achete-intelligemment-tuplejump-95669Elastic scaling in Kafka streamshttp://www.confluent.io/blog/elastic-scaling-in-kafka-streamsApache Bahir externalise les extensions de streaming de Spark dans un nouveau projet top level Apachehttp://thenewstack.io/apache-bahir-gives-spark-extensions-new-home/Utiliser Cloudera Impala sur Amazon S3http://blog.cloudera.com/blog/2016/09/apache-impala-incubating-vs-amazon-redshift-s3-integration-elasticity-agility-and-cost-performance-benefits-on-aws/Postgres Scalable avec Citus pour les times serieshttps://www.citusdata.com/blog/2016/08/30/citus-clouds-usage-of-citus-cloud/gRPChttps://cloudplatform.googleblog.com/2016/08/gRPC-a-true-Internet-scale-RPC-framework-is-now-1-and-ready-for-production-deployments.html?m=1Kafka + Google CP https://cloud.google.com/blog/big-data/2016/09/apache-kafka-for-gcp-users-connectors-for-pubsub-dataflow-and-bigqueryZeppelin sur La GCP https://cloud.google.com/blog/big-data/2016/09/analyzing-bigquery-datasets-using-bigquery-interpreter-for-apache-zeppelinLes Datageeks à Microsoft Experiences 2016http://www.meetup.com/fr-FR/Paris-Datageeks/events/234174268/Le Talk d'Alexis Seigneurin d'IpponLa video : https://www.youtube.com/watch?v=ps8JIqt1QJALes slides : https://speakerdeck.com/aseigneurin/lessons-learned-using-spark-and-microservices
23-9-2016 • 41 minuten, 38 seconden
Episode 27 : Cassandra: passé, présent et futur avec Jonathan Ellis et Alain Rodriguez
7-7-2016 • 1 uur, 20 minuten, 31 seconden
Episode 26 : Quelques news autour du Spark summit 2016
28-6-2016 • 51 minuten, 12 seconden
Episode 25 : Led Notebook
13-6-2016 • 1 uur, 7 minuten
Episode 24 : Zookeeper, la maladie du bigdata
23-5-2016 • 1 uur, 7 minuten, 34 seconden
Episode 23 : Kafka à DevoxxFR
16-5-2016 • 1 uur, 27 minuten, 28 seconden
Episode 22 : Reborn
2-5-2016 • 47 minuten, 59 seconden
Episode 21 : 67 Mds
29-10-2015 • 13 minuten, 8 seconden
Episode 20 : Retour d'experience sur Cassandra
3-9-2015 • 1 uur, 26 minuten, 40 seconden
Episode 19 : Scikit-Learn avec Olivier Grisel
17-6-2015 • 49 minuten, 28 seconden
Episode 18 : Pour se renseigner il faut regarder
3-6-2015 • 51 minuten, 3 seconden
Episode 17 : Drill, R , Spark, etc...
19-5-2015 • 21 minuten, 11 seconden
Episode 16 : Build a Notebook
5-5-2015 • 16 minuten, 43 seconden
Episode 15 : No one buys Hadoop
21-4-2015 • 17 minuten, 50 seconden
Episode 14 : Hadoop au sommet
14-4-2015 • 18 minuten, 30 seconden
Episode 13 : Ecoute bien Larry
7-4-2015 • 13 minuten, 30 seconden
Episode 12 : News etc... les suspects habituels
31-3-2015 • 14 minuten, 16 seconden
Episode 11 : Spark, Flink...
24-3-2015 • 16 minuten, 44 seconden
Episode 10 : Machine Learning dans la pratique avec Sam Bessalah
12-1-2015 • 42 minuten, 26 seconden
Episode 09 : Mongodb avec Tugdual Grall
30-12-2014 • 1 uur, 15 seconden
Episode 08 : NOSQL avec Sam Bessalah
18-12-2014 • 44 minuten, 53 seconden
Episode 07 : Apache Cassandra avec Victor Coustenoble
25-11-2014 • 41 minuten, 55 seconden
Episode 06 : Datascience et Challenges Kaggle avec Christophe Bourguignat.
16-11-2014 • 40 minuten, 50 seconden
Episode 05 : Hadoop et Talend avec Cédric Carbone.
20-10-2014 • 56 minuten, 21 seconden
Episode 04 : Azure Machine Learning par Benjamin Guinebertière.
26-9-2014 • 1 uur, 6 minuten, 5 seconden
Episode 03 : Ubeeko et HFactory avec Ghislain Mazars
5-9-2014 • 1 uur, 5 minuten, 50 seconden
Episode 02 : Retour sur Google I/O avec William Vambenepe
2-7-2014 • 35 minuten, 4 seconden
Episode 01 : Azure ML, Pig, Hadoopsummit et Actualités.