LCC 243 - Interview SRE avec Nicolas Helleringer et Maxime Brugidou - partie 1 - a podcast by Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, Aud

from 2020-12-04T08:48:05

:: ::

Nicolas et Maxime de Critéo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering).

Enregistré le 12 novembre 2020

Téléchargement de l’épisode LesCastCodeurs-Episode–243.mp3

Interview

Ta vie, ton oeuvre

Twotter Nicolas
Twitter Maxime
Criteo Labs

SRE en 2 phrases

Site Reliability Engineering C’est une façon de monter un salaire de sysadmin ?

Pourquoi

Ops et dev, pourquoi “merger” ?
DevOps avec un sysadmin dans l’équipe vs SRE
Cela a du sens de le faire sur un “petit projet” ou uniquement si on gère 300k machines ?

SRE au quotidien

Journée type

Dashboard

On code en quoi?

Pager (pendant les horaires travails vs dehors)
Les weekends

Taille SRE pour pour du 24/7

Combien de fois est-on appelé par nuit ? Prod fallback

Le development

Livre: le projet Unicorn

Concepts intéressants

50% eng

SLO SLI SLA
La difficulté de la valeur initiale
Perf passées vs calcul théorique

Error budget
Blast radius
Burn rate

Pré conclusion

C’est la fin de la partie 1 de cette interview

Nous contacter

Faire un crowdcast ou une crowdquestion
Contactez-nous via twitter https://twitter.com/lescastcodeurs
sur le groupe Google https://groups.google.com/group/lescastcodeurs
ou sur le site web https://lescastcodeurs.com/
Flattr-ez nous (dons) sur https://lescastcodeurs.com/
En savoir plus sur le sponsoring? sponsors@lescastcodeurs.com

Further episodes of Les Cast Codeurs Podcast

Further podcasts by Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, Aud

Website of Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, Aud