여기서 시작 하시겠습니까? 이 강의는 데이터 분석을위한 SQL 사용에 대한 전체 길이 자습서의 일부입니다. 시작 부분을 확인하세요.
이 강의에서는 다음 내용을 다룹니다.
- 외부 조인
- Crunchbase 데이터 세트
외부 조인
내부 조인을 수행 할 때 다른 테이블에서 일치하지 않는 두 테이블의 행은 반환되지 않습니다. 외부 조인에서는 한 테이블 또는 두 테이블 모두에서 일치하지 않는 행이 반환 될 수 있습니다. 다음은 몇 가지 유형의 외부 조인입니다.
-
LEFT JOIN
는 왼쪽 테이블에서 일치하지 않는 행만 반환합니다. -
RIGHT JOIN
는 오른쪽 테이블에서 일치하지 않는 행만 반환합니다. -
FULL OUTER JOIN
는 두 테이블 모두에서 일치하지 않는 행을 반환합니다.
외부 조인에 대한 다음 강의를 진행할 때 Patrik Spathon의이 JOIN 시각화를 참조하는 것이 도움이 될 수 있습니다.
Crunchbase 데이터 세트
다음 강의의 데이터는 스타트 업, 창립자, 투자자 및 모든 활동의 크라우드 소싱 색인 인 Crunchbase에서 가져 왔습니다. 셋. 2014 년 2 월 5 일에 수집되었으며이 강의를 위해 두 테이블의 많은 부분이 무작위로 삭제되었습니다. 첫 번째 테이블은 데이터베이스에있는 회사의 상당 부분을 나열합니다. 회사 당 한 행. permalink
필드는 각 행의 고유 식별자이며 웹 주소도 표시합니다. 표의 각 회사에 대해 Crunchbase의 웹 도메인 뒤에 영구 링크를 복사 / 붙여 넣기하여 온라인 Crunchbase 프로필을 볼 수 있습니다. 예를 들어 표의 세 번째 회사 인 “.Club Domains”에는 영구 링크 “/ company / club-domains”가 있으므로 프로필 주소는 http://www.crunchbase.com/company/club-domains가됩니다. 이름에 “funding”이있는 필드는 각 회사가 얼마나 많은 외부 투자 (USD)를 수행했는지와 관련이 있습니다. 나머지 필드는 설명이 필요하지 않습니다.
두 번째 표에는 획득 당 한 행씩 획득이 나열됩니다. 이 표의 company_permalink
는 이전 강의에서 설명한대로 tutorial.crunchbase_companies
의 permalink
필드에 매핑됩니다. . 이 두 필드를 결합하면 인수중인 회사에 대한 정보가 추가됩니다.
acquirer_permalink
라는 별도의 필드도 있음을 알 수 있습니다. 인수 회사에 대한 추가 정보를 추가하려면 permalink
필드 tutorial.crunchbase_companies
에 매핑됩니다.
이 두 테이블을 조인하는 데 사용하는 외래 키는 인수 회사 또는 인수 한 회사에 대한 정보를 추가할지 여부에 따라 전적으로 달라집니다.
그게 가치가 있습니다. 이러한 유형의 구조는 일반적입니다. 예를 들어 전송 된 이메일 목록을 보여주는 표에는 sender_email_address
및 recipient_email_address
가 포함될 수 있습니다. 둘 다 이메일 주소와 소유자 이름을 나열하는 테이블에 매핑됩니다.