はなちるのマイノート

Unityをメインとした技術ブログ。自分らしくまったりやっていきたいと思いますー!

【Unity】AngleSharpを使ってJavaScriptを含むサイトのスクレイピングをする(導入まで)

はじめに

今回はJavaScriptを含むサイトをスクレイピングするためにAngleSharpを導入してみる記事になります!

AngleSharpを導入するのにかなり手間取ってしまったので、備忘録の意味合いもかねて一連の流れを書き残しておきたいと思います。

ちなみにAngleSharpを使ったサンプルはこちら↓↓
AngleSharp/Examples.md at master · AngleSharp/AngleSharp · GitHub

Nugetから取得する

AngleSharpをUnityで使う場合は公式でNuGetから取得することを推奨しています
AngleSharp - Frequently Asked Questions

f:id:hanaaaaaachiru:20190705170613p:plain

ということでVisual Studioもしくはこちらから目的のパッケージをダウンロードします。

www.hanachiru-blog.com

3つのパッケージをダウンロードする

HtmlをパースするのみならAngleSharpのパッケージだけで良いのですが、今回のような場合はこれを含む3つのパッケージをダウンロードする必要があります。

  • AngleSharp
  • AngleSharp.Scripting.JavaScript
  • Jint

しかし、複数のパッケージをダウンロードする場合は依存関係に注意する必要があります

そちらについて詳しく見ていきましょう。

依存関係に注意する

それぞれのパッケージには他のパッケージ・.NET Frameworkのバージョンに依存関係があります。

f:id:hanaaaaaachiru:20190705171949p:plain
Visual Studioの場合

f:id:hanaaaaaachiru:20190705172013p:plain
ブラウザのNuGetの場合

例えば.NET Framework v4.5のときは、AngleSharp v0.9.9AngleSharp.Scripting.JavaScript v0.5.1Jint v2.10.4のパッケージをダウンロードする必要があります。

どれも最新版がいいだろうと思ってダウンロードしてしまうと、エラーになってしまう可能性が高いので注意しましょう。

またUnityは、.NET 4.x.NET Standard 2.0、( .NET 3.5)に対応しています。

さいごに

この依存関係を無視してダウンロードしまくっていたら後で痛い目をみてしまいました。

是非同じ被害者が増えないように、ダウンロードする前にチェックを。