你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是 Trino? (预览版)

重要

此功能目前以预览版提供。 Microsoft Azure 预览版的补充使用条款包含适用于 beta 版、预览版或其他尚未正式发布的 Azure 功能的更多法律条款。 有关此特定预览版的信息,请参阅 Azure HDInsight on AKS 预览版信息。 如有疑问或功能建议,请在 AskHDInsight 上提交请求并附上详细信息,并关注我们以获取 Azure HDInsight Community 的更多更新。

Trino(前 PrestoSQL)是开源分布式 SQL 查询引擎,用于针对异类数据源进行联合和交互式分析。 它可以从多个源大规模查询数据(GB 到 PB),以启用企业范围的分析。

Trino 用于各种分析用例,是交互式和即席查询的极佳选择。

Trino 提供的一些关键功能 -

  • 自适应多租户系统,能够同时运行数百个内存、I/O 和 CPU 密集型查询,并扩展到数千个工作器节点,同时有效利用群集资源。
  • 可扩展联合设计,减少了集成多个系统的复杂性。
  • 高性能,具有多个关键相关功能和优化。
  • 与 Hadoop 生态系统完全兼容。

有两种类型的 Trino 服务器:协调器和辅助角色。

Coordinator

Trino 协调器是负责分析语句、规划查询和管理 Trino 工作器节点的服务器。 它是 Trino 安装的“大脑”,也是客户端与之连接以提交语句供执行的节点。 协调器跟踪每个辅助角色上的活动,并协调查询的执行。 协调器创建查询的逻辑模型,该模型涉及一系列阶段,这些阶段转换为一系列连接任务,这些任务在 Trino 辅助角色群集上运行。

工作人员

Trino 辅助角色是 Trino 安装中的服务器,负责执行任务和处理数据。 工作器节点从连接器中提取数据,并相互交换中间数据。 协调器负责从辅助角色中提取结果,并将最终结果返回到客户端。

关系图显示 Trino 体系结构。