F5 collabore avec Microsoft sur la phase 2 du projet open source OpenTelemetry avec Apache Arrow (OTAP). Dans le cadre de ce projet, les données OpenTelemetry seront consommées, traitées et exportées à l'aide de lots d'enregistrements Apache Arrow du SDK vers l'agent, le collecteur et le backend. S'appuyant sur le succès de la phase 1, qui a vu des améliorations spectaculaires dans les taux de compression des données de télémétrie, ce prochain chapitre vise à repousser encore plus loin les limites d'OpenTelemetry avec un pipeline de traitement de données natif d'Arrow et basé sur Rust.
La collaboration entre F5 et Microsoft sur la phase 2 du projet OpenTelemetry avec Apache Arrow permettra de développer un pipeline de télémétrie haute performance intégré à l'écosystème Apache Arrow, avec une gamme d' applications pour des utilisations à petite et grande échelle. Nous créons de nouvelles bibliothèques de pipelines de télémétrie dans le langage Rust et nous visons à fournir cette fonctionnalité grâce à l'intégration avec le collecteur OpenTelemetry existant.
Cette collaboration est sur le point d'apporter des améliorations de performances innovantes pour les systèmes de télémétrie, marquant une étape importante non seulement pour OpenTelemetry mais également pour les écosystèmes plus larges d'Apache Arrow et de Rust. Nous sommes confiants dans notre approche et mettons désormais en œuvre activement ce nouveau pipeline basé sur Rust et effectuons des analyses comparatives approfondies des performances pour démontrer clairement les avancées.
La phase 1 d'OpenTelemetry avec Apache Arrow s'est fixée des objectifs ambitieux. En introduisant des innovations dans le protocole OpenTelemetry (OTLP), cette phase a optimisé le transport des données de télémétrie comme jamais auparavant. Les taux de compression ont été améliorés de 30 à 70 % par rapport au protocole OTLP standard, une réalisation remarquable qui a jeté les bases des travaux à venir.
Mais la phase 1 n’était que la pointe de l’iceberg. Cela a prouvé la puissance de la combinaison d'OpenTelemetry et d'Apache Arrow, et a ouvert la voie à une mission encore plus vaste : transformer l'ensemble du pipeline OpenTelemetry en une centrale de traitement de données en colonnes hautes performances.
Dans la phase 2, F5 et Microsoft approfondissent l'optimisation des performances en développant un pipeline OpenTelemetry entièrement natif alimenté par Rust et Apache Arrow dans le but de créer des pipelines Rust pour le collecteur Golang. Cela entraînera des améliorations spectaculaires dans l’utilisation du processeur, l’efficacité de la mémoire, le débit et la latence, qui contribuent tous à un écosystème de traitement des données plus efficace.
Notre objectif est également d'équilibrer la compression optimale des données, le traitement accéléré des données et l'intégration efficace avec une observabilité moderne orientée colonnes, distinguant cette initiative des autres projets principalement axés sur la compression seule, tels que STEF.
La décision de se lancer à fond dans Rust a suscité de l'enthousiasme - et un peu de controverse - au sein de la communauté technique. Après tout, le projet Collector d’OpenTelemetry est traditionnellement construit à l’aide de Golang. Alors pourquoi Rust ?
Rust et Apache Arrow sont comme les meilleurs amis dans le monde du traitement des données. Les deux technologies se complètent de manière profonde, faisant de Rust le choix idéal pour le développement de la phase 2. Voici quelques raisons :
Avec Rust et Apache Arrow à la barre, OpenTelemetry avec Apache Arrow ne s'attaque pas seulement aux mesures de performance : il prépare le terrain pour une adoption plus large dans les écosystèmes de télémétrie et de données.
Imaginez un monde où les pipelines de télémétrie sont parfaitement intégrables dans les lacs de données, offrant des connexions directes aux plates-formes d’analyse orientées colonnes. Ce pipeline de bout en bout, sans copie, permettra aux données de télémétrie de circuler de manière transparente de la production aux systèmes en aval, débloquant des intégrations auparavant inimaginables au sein d'OpenTelemetry.
En préservant l'intégrabilité, en priorisant les contrôles de mémoire stricts et en permettant la prise en charge de l'exécution thread par cœur, la phase 2 garantit que ce paradigme basé sur Rust non seulement dépassera les attentes, mais restera également accessible aux développeurs et aux entreprises.
Malgré le buzz autour de Rust, la phase 2 ne signifie pas que Golang doit être abandonné. En fait, F5 et Microsoft prennent des mesures prudentes pour garantir la compatibilité entre les pipelines Go et Rust. Les adaptateurs et les composants OpenTelemetry Collector existants écrits en Golang continueront d'être pris en charge et maintenus. Cela garantit l’interopérabilité, permettant aux organisations de choisir le meilleur ensemble d’outils pour leurs flux de travail sans être enfermées dans un seul langage.
Cette approche unificatrice s’aligne sur l’engagement d’OpenTelemetry à développer l’écosystème, et non à le fracturer. En reliant les pipelines Rust et Go dans le cadre d'un flux de travail interconnecté, la collaboration garantit qu'OpenTelemetry reste accessible à sa base d'utilisateurs diversifiée.
Le comité de gouvernance d'OpenTelemetry a approuvé la phase 2, reconnaissant l'importance d'explorer les innovations basées sur Rust tout en maintenant l'harmonie au sein de l'écosystème OpenTelemetry plus large. Les contributions du F5, comme la bibliothèque « Beaubourg », ont déjà fourni une base solide sur laquelle s’appuyer.
Alors que F5 et Microsoft collaborent sur ce projet, ils n’optimisent pas seulement les performances : ils ouvrent également la voie à des possibilités passionnantes pour le monde de la télémétrie. Cet investissement dans l’innovation en dit long sur l’engagement d’OpenTelemetry à rester à la pointe des systèmes de télémétrie open source.
Pour ceux qui suivent les progrès d’OpenTelemetry avec Apache Arrow, la phase 2 représente un bond en avant en termes d’efficacité, d’évolutivité et de flexibilité. En utilisant Rust et Apache Arrow à leur plein potentiel, cette collaboration a le potentiel de redéfinir la manière dont les données de télémétrie sont produites, traitées et consommées.
Alors que la communauté technique attend les résultats de cette phase ambitieuse, une chose est claire : OpenTelemetry avec Apache Arrow contribue à façonner l’avenir des systèmes d’observabilité distribués.
Restez informé pour plus d’informations sur les développements de la phase 2 et sur la manière dont ce projet ouvre la voie à un avenir de données en colonnes hautes performances. Construisons en grand, et vite.
La collaboration entre F5 et Microsoft incarne l'esprit de l'innovation open source, et nous sommes ravis de voir comment ces efforts élèvent OpenTelemetry pour nous tous. Ensemble, nous n’adoptons pas seulement des outils modernes : nous redéfinissons ce qui est possible. Pour en savoir plus, lisez l’article du blog Microsoft .