15
Spark에서 DataFrame, Dataset 및 RDD의 차이점
난 그냥 사이의 차이 무엇인가 궁금 RDD하고 DataFrame (스파크 2.0.0 DataFrame가 단순한 유형의 별칭 Dataset[Row]) 아파치 스파크에서? 하나를 다른 것으로 바꿀 수 있습니까?
Apache Spark SQL은 고속 범용 클러스터 컴퓨팅 시스템 인 Spark에서 "SQL 및 구조화 된 데이터 처리"를위한 도구입니다. Hive, Parquet 등에서 데이터를 검색하고 기존 RDD 및 데이터 세트에 대해 SQL 쿼리를 실행하는 데 사용할 수 있습니다.