ここから始めますか?このレッスンは、SQLをデータ分析に使用するための完全なチュートリアルの一部です。冒頭を確認してください。
このレッスンでは、以下について説明します。
- 外部結合
- Crunchbaseデータセット
外部結合
内部結合を実行すると、一方のテーブルで他方のテーブルで一致しない行が返されません。外部結合では、一方または両方のテーブルで一致しない行が返されます。外部結合にはいくつかの種類があります。
-
LEFT JOIN
は、左側のテーブルから一致しない行のみを返します。 -
RIGHT JOIN
は右側のテーブルから一致しない行のみを返します。 -
FULL OUTER JOIN
は両方のテーブルから一致しない行を返します。
外部結合に関する次のレッスンを進める際に、PatrikSpathonによるこのJOIN視覚化を参照すると役立つ場合があります。
Crunchbaseデータセット
次のレッスンのデータは、スタートアップ、創設者、投資家、およびすべての活動のクラウドソースインデックスであるCrunchbaseから取得されました。 三。これは2014年2月5日に収集され、このレッスンのために両方のテーブルの大部分がランダムに削除されました。最初の表は、データベース内の企業の大部分を示しています。会社ごとに1行。 permalink
フィールドは、各行の一意の識別子であり、Webアドレスも表示します。表内の各企業について、CrunchbaseのWebドメインの後にパーマリンクをコピーして貼り付けることで、オンラインのCrunchbaseプロファイルを表示できます。たとえば、テーブルの3番目の会社「.ClubDomains」にはパーマリンク「/ company / club-domains」があるため、そのプロファイルアドレスはhttp://www.crunchbase.com/company/club-domainsになります。名前に「資金」が含まれているフィールドは、各企業が行った外部投資(米ドル)の量と関係があります。残りのフィールドは一目瞭然です。
2番目の表は、取得を一覧表示します(取得ごとに1行)。この表のcompany_permalink
は、前のレッスンで説明したように、tutorial.crunchbase_companies
のpermalink
フィールドにマップされます。 。これらの2つのフィールドを結合すると、買収する会社に関する情報が追加されます。
acquirer_permalink
という別のフィールドもあります。これも可能です。 permalink
フィールドtutorial.crunchbase_companies
にマップして、買収企業に関する追加情報を追加します。
これら2つのテーブルを結合するために使用する外部キーは、「買収企業または買収企業に関する情報を追加するかどうかによって異なります。
価値があります。この種の構造は一般的であることに注意してください。たとえば、送信された電子メールのリストを示すテーブルには、sender_email_address
とrecipient_email_address
が含まれる場合があります。どちらも、メールアドレスとその所有者の名前を一覧表示するテーブルにマップされます。