Starter du her? Denne leksjonen er en del av en fullstendig opplæring i bruk av SQL til dataanalyse. Sjekk ut begynnelsen.
I denne leksjonen skal vi dekke:
- Ytre sammenføyninger
- Crunchbase-datasettet
Ytre sammenføyninger
Når du utfører en indre sammenføyning, returneres ikke rader fra begge tabellene som ikke er matchet i den andre tabellen. I en ytre sammenføyning kan uavhengige rader i den ene eller begge tabellene returneres. Der er noen få typer ytre sammenføyninger:
-
LEFT JOIN
returnerer bare umatchede rader fra venstre tabell. -
RIGHT JOIN
returnerer bare umatchede rader fra høyre tabell. -
FULL OUTER JOIN
returnerer umatchede rader fra begge tabeller.
Når du arbeider gjennom følgende leksjoner om ytre sammenføyninger, kan det være nyttig å referere til denne JOIN-visualiseringen av Patrik Spathon.
Crunchbase-datasettet
Dataene for følgende leksjoner ble hentet fra Crunchbase, en folkeindeks av startups, grunnleggere, investorer og aktivitetene til alle tre. Den ble samlet 5. februar 2014, og store deler av begge bordene ble tilfeldig droppet av hensyn til denne leksjonen. Den første tabellen viser en stor del av selskapene i databasen; en rad per selskap. permalink
-feltet er en unik identifikator for hver rad, og viser også nettadressen. For hvert selskap i tabellen kan du se Crunchbase-profilen på nettet ved å kopiere / lime inn permalinken etter Crunchbase’s nettdomene. For eksempel har det tredje selskapet i tabellen «.Club Domains» permalinken «/ company / club-domains,» så profiladressen vil være http://www.crunchbase.com/company/club-domains. Feltene med «finansiering» i navnet har å gjøre med hvor mye investering utenfor (i USD) hvert selskap har påtatt seg. Resten av feltene er selvforklarende.
Den andre tabellen viser anskaffelser – en rad per anskaffelse. company_permalink
i denne tabellen tilordnes til permalink
-feltet i tutorial.crunchbase_companies
som beskrevet i forrige leksjon . Å bli med i disse to feltene vil legge til informasjon om selskapet som blir anskaffet.
Du vil også merke at det er et eget felt som heter acquirer_permalink
. Dette kan også være kartlagt til permalink
-feltet tutorial.crunchbase_companies
for å legge til ytterligere informasjon om det overtakende selskapet.
Den utenlandske nøkkelen du bruker for å bli med i disse to tabellene, vil helt avhenge av om du ønsker å legge til informasjon om det overtakende selskapet eller selskapet som ble kjøpt.
Det er verdt å merke seg at denne typen struktur er vanlig. For eksempel kan en tabell som viser en liste over sendte e-postmeldinger inneholde en sender_email_address
og en recipient_email_address
, begge tilordnes til en tabell med e-postadresser og navn på eierne.