RedshiftS3GlueAthenaEMR
한 회사가 IoT 장치에서 대량의 데이터를 수집하고 있습니다. 데이터는 영구 Amazon EMR 클러스터의 HDFS(Hadoop Distributed File System)에 ORC(Optimized Row Columnar) 파일로 저장됩니다. 회사의 데이터 분석 팀은 동일한 EMR 클러스터에 배포된 Apache Presto에서 SQL을 사용하여 데이터를 쿼리합니다. 쿼리는 많은 양의 데이터를 스캔하고 항상 15분 미만 동안 실행되며 오후 5시에서 오후 10시 사이에만 실행됩니다. 회사는 현재 솔루션과 관련된 높은 비용에 대해 우려하고 있습니다. 솔루션 설계자는 SQL 데이터 쿼리를 허용하는 가장 비용 효율적인 솔루션을 제안해야 합니다. 이러한 요구 사항을 충족하는 솔루션은 무엇입니까?