ParquetFileReader1 [Java DataEngineering] Parquet 파일 쓰고 읽는 코드 정리 Write & Read Java를 이용해 Parquet 파일을 쓰고 읽는 코드를 소개한다. 라이브러리 버전 정보 org.apache.parquet:parquet-avro:1.12.2 org.apache.hadoop:hadoop-common:3.3.4 org.apache.hadoop:hadoop-mapreduce-client-core:3.3.4 유의점 parquet 파일 저장 코드를 소개하는 포스트들은 대게 Path 경로만 넣어서 writer를 빌드하는 방법을 사용한다. 허나 아쉽게도 해당 코드는 Deprecated 처리되었는데 이유는 정확히 모르겠다.. 어쨌거나 Path가 아닌 org.apache.parquet.io.OutputFile (interface) 를 구현한 클래스를 넣어야 한다. https://issues.apach.. 2022. 11. 25. 이전 1 다음