R est plus performant que Python. Allez donc raconter ça aux banques

eFC logo
R est plus performant que Python. Allez donc raconter ça aux banques

Les data scientists les plus réputés préfèrent R à Python, mais pour qui veut travailler en data science ou machine learning en banque d’investissement, mieux vaut sans doute mettre de côté toute subjectivité en faveur de R. Dans la grande majorité, les banques lui préfèrent Python.

« Dans les banques, Python est préféré à R pour plusieurs raisons, » indique le responsable data science d’une grande banque en poste à NewYork. « Il y a plus de packages de machine learning tels que sklearn dans Python ; c’est mieux pour les tâches de programmation génériques et plus facile à mettre en production ; sans compter que Python convient mieux pour le nettoyage des données (comme Perl en son temps) et pour l’analyse de textes.

C’est la raison pour laquelle, selon lui, les banques ont quasiment transféré l’intégralité de leur analyse de données en Python. Il y a bien quelques exceptions : certains postes de strat utilisent R, mais la plupart du temps, Python reste prédominant.

Quoi qu’il en soit, R a toujours ses adeptes. Jeffrey Ryan, ancien quant star de Citadel, en fait partie et organise même une conférence annuelle sur en finance (annulée cette année en raison de la COVID-19). « R a été conçu pour être centré sur les données et a été développé par des chercheurs, » raconte Jeffrey Ryan, « alors que Python agrégeait les trames de données et les séries chronologiques via Pandas [la bibliothèque de logiciels libres pour la manipulation des données dans Python, développée par Wes McKinney, un ancien développeur logiciel de Two Sigma.] »

R est toujours utilisé en statistique et en recherche, ajoute Jeffrey Ryan. Par comparaison, Python est l’outil de « l’analyse des données à la portée de tous, » très facile à utiliser sans apprendre la statistique. Comme il le rappelle, « Python a trouvé un tout nouveau public de programmeurs au bon moment. » Avant de préciser : « Lorsque les programmeurs (plus nombreux que les statisticiens) veulent travailler sur les données, Python présente l’avantage d’être un langage « à tout faire » - même si techniquement il n’a pas été conçu pour ça. »

Compte tenu de l’importance des données dans les services financiers, on peut imaginer que les banques préfèreraient le langage offrant le plus de capacités, même s’il est plus difficile à maîtriser. Pourtant, Graham Giller, CEO de Giller Investments et ex-responsable data science chez JPMorgan et Deutsche Bank, confirme que les banques ont adopté Python plutôt que R car les départements informatiques des banques sont essentiellement dirigés par des informaticiens plutôt que des personnes très axées sur les données.

« Personnellement, j’aime beaucoup R, » confie Graham Giller. « R est bien plus un outil pour les professionnels de la statistique, à savoir les gens intéressés par les inférences sur les données, que pour les informaticiens, plus portés sur le code. » Alors que les informaticiens ont gagné du terrain dans les banques, il ajoute que les banques justement « ont remplacé les quants par des professionnels de l’informatique ou par d’autres quants qui souhaitent au fond devenir des professionnels de l’informatique, » et qui ont apporté Python dans leurs bagages.

Pour les purs mathématiciens de la finance, tout cela est un peu frustrant. Pandas a été développé sur R mais a pris son propre envol. « Au début, Pandas était un moyen d’apporter à Python un environnement similaire à celui de R, » poursuit Graham Giller, notant au passage que Pandas peut être « horriblement lent et inefficace » par comparaison.

Cela dit, la plupart des gens n’en ont que faire : plus Python et Pandas sont utilisés, plus les études de cas sont nombreuses. « R a une base d’utilisateurs plus modeste que Python à ce stade, » relève Graham Giller. « Ce qui implique par conséquent que de nombreux outils commencent à se créer autour de Python et des données, un effet boule de neige qui contribue à amplifier son succès. »

Crédit photo : Vitaly Vlasov chez Pexels

Contact: sbutcher@efinancialcareers.com in the first instance. Whatsapp/Signal/Telegram also available (Telegram: @SarahButcher)

Bear with us if you leave a comment at the bottom of this article: all our comments are moderated by human beings. Sometimes these humans might be asleep, or away from their desks, so it may take a while for your comment to appear. Eventually it will – unless it’s offensive or libelous (in which case it won’t.)

A lire aussi…

Secteurs les plus recherchés

Loading...

Recherche emploi

Rechercher articles

Close
Loading...