データの価値

(へ ジョルジオトシ)
16/02/22

インターネットには、さまざまな種類やソースの大量のデータが含まれていることが知られています。 これらのブラウザを介して参照できるデータは、テキストのみ (記事を読むなど) またはマルチメディア (オーディオ、ビデオ、ストリーミング) でネットワークと対話できるようにするために一般的に利用可能です。

したがって、このデータはすべて誰でも利用でき、日常生活の選択に役立つ情報を抽出するために使用できるようです。

実際には、物事はそれほど透明で単純ではありません。 実際、このデータの使用方法は、マンとマシンの関係を特徴づける対話性を考慮して設計されています。 このデータを再利用して個人的な方法で処理し、個々のユーザーにとって特に関心のある情報を抽出したい場合に問題が発生します。

明確にするために、任意の市場 (ボルサ イタリアーナ、ニセ、ナスダックなど) の株価の例を参照してください。株価の傾向 (TICKER) を分析でき、価格、取引数量、毎日の高値と安値などに関する一連のデータを提供するサイトが多数あります。 このデータへのインターフェイスは、前述したように、人間と機械の対話の典型的なもの、つまりブラウザーです。

このデータをローカルで処理して、興味のある情報を抽出したい場合、作業は大幅に複雑になります。 プログラム インターフェイスから同じデータにアクセスするには、2 つの方法論が利用可能です。 ウェブスクレイピング または、API REST (representational state transfer) や SOAP (Simple Object Access Protocol) などの特別なデータ インターフェイスを介してアクセスします。REST は、最も広く普及し使用されているソリューションです。

XNUMX つの選択肢を簡単に分析してみましょう。 の ウェブスクレイピング これは、対象の Web ページをクライアントに転送し、そこに介入して対象のデータを特定することで、人間の行動をエミュレートすることに基づいています。 パターン 既知の認識。 たとえば、HTML ページの意図に関係するデータを識別できる特定の HTML タグを使用します。

ライブラリはさまざまなプログラミング言語 (JavaScript、Python、Java など) で利用でき、何らかの方法で特定のデータの識別と認識を容易にしますが、その手順は即時ではなく、エラーが発生しやすくなります。 さらに、ソース HTML ページが変更された場合、 スクリプト 開発するとエラーが発生します。 パターン したがって、この解決策は可能ではありますが、実装の複雑さと HTML ページの構造への厳密な依存により、問題が発生する可能性があります。

代わりにプログラム インターフェイス API REST (または SOAP) に基づいたソリューションは、絶対的により堅牢で実装が簡単です。

これらのインターフェイスの役割は、データへのアクセス方法を標準化することです。 したがって、REST インターフェイスの場合は、HTTP テクノロジが使用され、要求されたデータは、対象のデータを一意に識別する方法で構築された特定の URL の GET 経由で読み取られます。

例として、イタリア銀行が提供する通貨換算サービスの REST インターフェイスにアクセスするための URL を報告します。

https://tassidicambio.bancaditalia.it/terzevalute-wf-web/rest/v1.0/dailyRates?referenceDate={date}&baseCurrencyIsoCode={から}¤cyIsoCode={とっと}&lang={“ja”}

太字の用語は、関係する通貨と換算率の評価日を定義するために使用されます。 その URL に対する GET 操作は、求められた値を返します。 この操作は、適切なライブラリを使用することで、任意のプログラミング言語 (Python、JavaScript、C# など) から簡単に実装できます。

このタイプのインターフェースをベースにした無料サービスは数多くありますが、興味深いのは、有料の金融情報を提供するサイトが多数あることです。 これらは通常、世界中の市場や企業に関する財務情報に関連する側面の完全な概要を提供する、特に詳細なデータです。 これらのサイト、特に経済的および金融的側面に関連するサイトのうち、どれだけのサイトが何らかの形式の購読をしないと完全なアクセスを提供していないのかを強調したいと思います。

基本的に、プログラム インターフェイスを介したデータの使用には支払いが必要です。 これは、インターネットでは真の価値はデータにあるという、見落とされがちな基本概念を強化するのに役立ちます。 上場企業の集約されて使用可能であるがまだ公開されているデータに特定の価値があり、サブスクリプションの対象になっている場合、私たちは多かれ少なかれ意識的に、電子商取引サイトやソーシャル ネットワークを管理する多数の企業に提供してきた個人データの価値を想像することができます。

リファレンス

購読ベースの金融情報を提供する多数のサイトのうちの XNUMX つ https://site.financialmodelingprep.com/developer/docs/pricing

REST インターフェイスの詳細については、こちらをご覧ください。 https://www.ibm.com/cloud/learn/rest-apis