Zewnętrzne połączenia SQL

Zaczynasz tutaj? Ta lekcja jest częścią pełnego samouczka dotyczącego używania języka SQL do analizy danych. Sprawdź początek.

W tej lekcji omówimy:

  • Zewnętrzne połączenia
  • Zestaw danych Crunchbase

Złączenia zewnętrzne

Podczas wykonywania sprzężenia wewnętrznego wiersze z dowolnej tabeli, które nie są dopasowane w drugiej tabeli, nie są zwracane. W przypadku sprzężenia zewnętrznego można zwrócić niedopasowane wiersze w jednej lub obu tabelach. jest kilka typów złączeń zewnętrznych:

  • LEFT JOIN zwraca tylko niedopasowane wiersze z lewej tabeli.
  • RIGHT JOIN zwraca tylko niedopasowane wiersze z prawej tabeli.
  • FULL OUTER JOIN zwraca niedopasowane wiersze z obu tabel.

Podczas pracy z następującymi lekcjami na temat zewnętrznych sprzężeń pomocne może być odniesienie się do wizualizacji JOIN autorstwa Patrika Spathona.

Zbiór danych Crunchbase

Dane do następnych lekcji zostały pobrane z Crunchbase, crowdsourcowanego indeksu start-upów, założycieli, inwestorów i działań wszystkich trzy. Został zebrany 5 lutego 2014 r., A duże części obu tabel zostały losowo usunięte ze względu na tę lekcję. Pierwsza tabela zawiera listę dużej części firm w bazie danych; jeden wiersz na firmę. Pole permalink jest unikatowym identyfikatorem dla każdego wiersza, a także zawiera adres internetowy. Dla każdej firmy w tabeli możesz wyświetlić jej profil online Crunchbase, kopiując / wklejając jej link bezpośredni za domeną internetową Crunchbase. Na przykład trzecia firma w tabeli, „.Club Domains”, ma link bezpośredni „/ company / club-domains”, więc jej adres profilu będzie wyglądał następująco: http://www.crunchbase.com/company/club-domains. Pola ze słowem „finansowanie” w nazwie mają związek z kwotą inwestycji zewnętrznej (w USD), jaką podjęła każda firma. Pozostałe pola nie wymagają objaśnień.

Druga tabela zawiera listę przejęć – jeden wiersz na pozyskanie. company_permalink w tej tabeli odwzorowuje pole permalink w tutorial.crunchbase_companies zgodnie z opisem w poprzedniej lekcji . Połączenie tych dwóch pól spowoduje dodanie informacji o przejmowanej firmie.

Zauważysz, że istnieje również osobne pole o nazwie acquirer_permalink. Może to być również zmapowane na pole permalink tutorial.crunchbase_companies, aby dodać dodatkowe informacje o firmie przejmującej.

Klucz obcy, którego użyjesz do połączenia tych dwóch tabel, będzie zależał całkowicie od tego, czy chcesz dodać informacje o firmie przejmującej, czy o firmie, która została przejęta.

zauważając, że ten rodzaj struktury jest powszechny. Na przykład tabela pokazująca listę wysłanych e-maili może zawierać sender_email_address i recipient_email_address, z których oba są mapowane na tabelę zawierającą adresy e-mail i nazwiska ich właścicieli.

Leave a Reply

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *