Zaczynasz tutaj? Ta lekcja jest częścią pełnego samouczka dotyczącego używania języka SQL do analizy danych. Sprawdź początek.
W tej lekcji omówimy:
- Zewnętrzne połączenia
- Zestaw danych Crunchbase
Złączenia zewnętrzne
Podczas wykonywania sprzężenia wewnętrznego wiersze z dowolnej tabeli, które nie są dopasowane w drugiej tabeli, nie są zwracane. W przypadku sprzężenia zewnętrznego można zwrócić niedopasowane wiersze w jednej lub obu tabelach. jest kilka typów złączeń zewnętrznych:
-
LEFT JOIN
zwraca tylko niedopasowane wiersze z lewej tabeli. -
RIGHT JOIN
zwraca tylko niedopasowane wiersze z prawej tabeli. -
FULL OUTER JOIN
zwraca niedopasowane wiersze z obu tabel.
Podczas pracy z następującymi lekcjami na temat zewnętrznych sprzężeń pomocne może być odniesienie się do wizualizacji JOIN autorstwa Patrika Spathona.
Zbiór danych Crunchbase
Dane do następnych lekcji zostały pobrane z Crunchbase, crowdsourcowanego indeksu start-upów, założycieli, inwestorów i działań wszystkich trzy. Został zebrany 5 lutego 2014 r., A duże części obu tabel zostały losowo usunięte ze względu na tę lekcję. Pierwsza tabela zawiera listę dużej części firm w bazie danych; jeden wiersz na firmę. Pole permalink
jest unikatowym identyfikatorem dla każdego wiersza, a także zawiera adres internetowy. Dla każdej firmy w tabeli możesz wyświetlić jej profil online Crunchbase, kopiując / wklejając jej link bezpośredni za domeną internetową Crunchbase. Na przykład trzecia firma w tabeli, „.Club Domains”, ma link bezpośredni „/ company / club-domains”, więc jej adres profilu będzie wyglądał następująco: http://www.crunchbase.com/company/club-domains. Pola ze słowem „finansowanie” w nazwie mają związek z kwotą inwestycji zewnętrznej (w USD), jaką podjęła każda firma. Pozostałe pola nie wymagają objaśnień.
Druga tabela zawiera listę przejęć – jeden wiersz na pozyskanie. company_permalink
w tej tabeli odwzorowuje pole permalink
w tutorial.crunchbase_companies
zgodnie z opisem w poprzedniej lekcji . Połączenie tych dwóch pól spowoduje dodanie informacji o przejmowanej firmie.
Zauważysz, że istnieje również osobne pole o nazwie acquirer_permalink
. Może to być również zmapowane na pole permalink
tutorial.crunchbase_companies
, aby dodać dodatkowe informacje o firmie przejmującej.
Klucz obcy, którego użyjesz do połączenia tych dwóch tabel, będzie zależał całkowicie od tego, czy chcesz dodać informacje o firmie przejmującej, czy o firmie, która została przejęta.
zauważając, że ten rodzaj struktury jest powszechny. Na przykład tabela pokazująca listę wysłanych e-maili może zawierać sender_email_address
i recipient_email_address
, z których oba są mapowane na tabelę zawierającą adresy e-mail i nazwiska ich właścicieli.