StackOverflow par les nombres

Bon, promis, demain, les réseaux sociaux, j’arrête.
En attendant, aujourd’hui, je peux vous parler de StackOverflow.com. Je crois en avoir déjà parlé (mais en même temps je ne parle pas vraiment d’eux, dans cet article-là).
Bon, StackOverflow, donc, c’était à l’origine une idée d’un site communautaire reprenant quasiment trait pour trait – mais via le web – ce qui fit jadis le succès d’Usenet : un type pose une question, on lui répond, et il peut dire si la réponse lui plaît.
Eh bien sûr, comme l’idée a assez bien marché. StackOverflow a rapidement eu deux petis frères.
Et comme ça n’a pas suffit, et après des discussions acharnées, est même apparu un équivalent du fufe de Usenet : Area51. Et du coup, c’est reparti pour un tour, une autre légion de sites apparaît, ainsi qu’un site spécialement dédié à l’API de StackOverflow (et donc à l’extension du domaine de la communauté), et d’où je tiens mon formidable bot jabber.
Et enfin, l’un des éléments les plus utiles de StackOverflow, et de ses sites associés, c’est la mise à disposition des données sous forme de data dump. Outre le fait que le nombre de questions posées est réellement impressionant (puisqu’on dépasse déjà le million), ce data dump permet à quelques statisticiens fous de produire quelques graphiques rigolos. Et pas que rigolos, en fait. De ces graphiques, on peut ainsi déduire
  • qu’il vaut mieux poser sa question vers 14H UTC (voir le graphique Answers by hour)
  • que sans réponse deux heures après que la question ait été posée, il vaut mieux considérer qu’elle n’aura pas de réponse (voir le graphique Time to accepted answer)
Et puis sur le même site, le graphique des utilisations des tags montre lui aussi des choses intéressantes, mais sur lesquelles je vous laisse conclure ce que vous voulez 🙂
L’intérêt de tout ça, c’est aussi de montrer que StackOverflow offre non seulement un espace de discussion, mais aussi, à partir de cet espace de discussion, une espèce de Zeitgeist des développeurs, montrant peut-être plus que les sujets dont on parle les sujets qui posent problème (voir par exemple la différence d’utilisation des tags scala et groovy).
Et ça, ça donne quelque part envie de développer des outils d’analyse encore plus poussés, histoire d’avoir vraiment accès à cet esprit du moment. Mais là, je ne sais pas trop comment faire …
Cela dit, il y a un intérêt immédiat à le faire sur StackOverflow … c’est évidement que c’est réplicable sur tous les autres sites StackExchange sans effort !
Publicités

Une réflexion sur “StackOverflow par les nombres

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s