◆ Github の全パブリックプロジェクトのコミットの割合みたい
◆ 行数とかバイト数とかプロジェクト数よりは良い指標なのかも
◆ ウェブページを公開できる Github プロジェクトだから CSS が突出してる

こんなページを見つけました
https://www.languagehealth.com/

プログラミング言語がどれくらい使われてるか比較できるサイトです
「health」 という言葉が使われているので 利用率というのとはちょっと違う?

言語を指定するとグラフに線が増えていきます
デフォルトは

langhealth00

Go と Java と Ruby です
どれも使わない言語です

適当にいっぱい入れてみました

langhealth01

Assembly が一時期すごいことになっていますが 基本的には C が昔は多くて徐々に下がってます
CSS がだいたい 2010 年くらい? から徐々に上がってきて 2012 年くらい?に C を超えています

下の方は重なりすぎてよくわからないので 低いものを外していくとこんな感じです

langhealth02

何を元にしてるの

それぞれの数値をどうやって求めてるのか気になったのですが 「?」 ボタンを押すと出てくる説明に書かれていました

今のところは Github の全パブリックなプロジェクトのコミットの割合を見てるそうです

ただコミットの割合というのがよくわからないです
コミットには複数の言語があることもあるでしょうし コミットの大きさも様々です
通常 1 コミットは十分小さいものであるはずと考えてそのコミットで 1 番変更が多い言語をそのコミットの言語とみなして全コミットを集計した結果なのでしょうか

プロジェクトに一応入ってるけど変更が全くないようなファイルもありますし そのファイルの言語は利用されてるとは言いづらいです
1 コミットに含まれてる 50 ファイルよりは毎週 1 回 1 ファイルのコミットがある方がアクティブな言語と言えると思います
また ファイル数やバイト数が少なくても変更がよくあって頻繁にコミットされてるなら使われてる言語と言えると思います
言語によっては細かくファイル分割してファイル数が多くなるものや ちょっとした処理ををするだけでもコードが長くなあるものもありますし 行数やバイト数やファイル数を見るよりは良さそうな計測方法です

そう考えると本当に単純にコミット単位なのですかね
それにしても 全パブリックなプロジェクトの全コミットを集計なんてすごく大変そうです
億とか行ってない??


ただ Github で言語のパーセントというとこれが思い浮かびます

ghl

コミットとは書いてるものの 本当に 1 つ 1 つのコミットじゃなくて git にコミットした全ファイルを指してるだけで ここの表示のことだったりするのかなとも思えます
こっちだと プロジェクトに含まれるファイル数の割合なので ファイル数が多いほうがよく使われてる扱いされてしまうので違うのかな

css が 1 位だけど

css が 1 位はちょっと驚きましたが 計測方法が Github のプロジェクトのデータから持ってきてるとなると納得できますね
ただでさえ web 系のものが多いのに プロジェクト内に web ページとして見れるドキュメントやサンプルページが含まれていることが多いです
web ページのホスティング機能もあるので プログラムとか関係なく ブログやホームページ代わりとしても使えるので HTML や CSS は特に多いですからね

CSS が飛び出てるのに HTML や JavaScript がそうでないのは フレームワークなどを使っていると HTML はテンプレートとして別の拡張子になっていたり JavaScript も TypeScript や CoffeeScript など altJS を使っていると別拡張子になるからだと思います
CSS も SCSS などはありますが これらに比べると直接 CSS で書いてることが多いと思います

例えば php を使って出力したらそれだけで拡張子は html ファイルじゃなくなりますからね (html のまま php を実行することもできますけど)

そういうのを考えると一部の言語はあてにできなそうですが 人気じゃなくて実際に使われてると考えればこれも間違いではないかもしれません
「仕事がある」 とか 「有名な web サービスが何使ってる」 とは違って一般的なユーザも含めてどれくらい使われてるかを知りたいならけっこう良いサイトなのかもしれません