Googleは米国現地時間3月17日、「GooglebotがHTMLの中でインデックス対象とするのは15MBまで」という件において、JavaScriptもCSSもそれぞれ個別に15MBまでという旨でドキュメントを更新した旨、発表しました(日本語版ドキュメントも更新されていました)。要は、HTMLファイルから飛ぶJavaScriptもCSSもそれぞれ15MBまでインデックスするよ、という話です。以下ご紹介します。
- March 17:We further clarified that the 15MB fetch size limit applies to each fetch of the individual subresources referenced in the HTML as well (in particular, JavaScript and CSS files).
(2023年3月17日:15MBの読込サイズ制限について、HTMLと同様に参照する各リソース先[特に、JavaScriptとCSSファイル]にも当てはまることをより明記しました。)
Googleのドキュメント内容
HTMLファイルを読み込んでインデックスする対象は15MBまでとのことで、そのHTMLからの参照リソースである別ファイルはあくまでも15MBの対象外とのことでした。それについて、それぞれHTMLの参照リソースは個別に最初の15MBまで読み込む旨をドキュメント上に明記したとのことです。もともとGoogleでは、HTMLの読み込みを15MBとするという明記をした当時、HTML内でURLによって参照されているビデオや画像は別だということを記載しており、あくまでも15MBの制限はHTMLのソースだけだという認識ではおりましたので、特段新しい話ではありません。しかし、ややこしいのでしっかりとドキュメントに追記したのでしょう。日本語版のドキュメントにも以下のように記載されています。
私も仕事柄、様々なタイプのWebサイトを分析しますが、たまに異様に重たいJavaScriptがあったりします。検索システムや特殊なシステムを組んでいるようなWebサイトにありがちなのですが、かなり重たいです。それでもテキストベースなので、1MBくらいですかね。そう考えると15MBってよっぽどだとは思います。
大丈夫だとは思いますが…
今回の件は、HTMLで15MBまでの制限、そこからの参照ファイルに関してはCSSにせよJavaScriptにせよ、それぞれのファイル単位で15MBまでの制限ということなので、まぁ滅多にないかと思います。ですので大丈夫だとは思いますが、一応頭の片隅の片隅に置いておくと良いでしょう。