当前位置:主页 > 游戏服务器 > 应用安全 >

云服务器_企业邮箱怎么登陆_最新活动

对SQL还是noSQL:这是正确的问题吗?

对SQL还是noSQL:这是正确的问题吗?2016年3月31日作者:乔恩·伯克如何使用雪花,市场新闻本周花时间在圣何塞的Strata Hadoop会议上,如果没有看到或听到人们谈论Hadoop或Spark这样的noSQL平台,很难朝任何方向迈出几步以上。在过去的几年里,这些讨论经常导致关于"没有SQL"或"不仅仅是SQL"或"noSQL上的SQL"是否是下一波将取代SQL系统的争论。有时候,这些争论变得相当激烈——我不能说是有人扔椅子,还是接踵而至的争吵,但肯定有一些强烈的意见。这些争论和讨论常常演变成复杂的项目,试图构建一个"Hadoop数据仓库"或"Spark数据仓库"。然而,我看到了争论已经结束的迹象。人们不再争论SQL与noSQL,或数据仓库与noSQL数据湖的较量,而是超越了可能构建到更为基础的现实的宏大愿景。以前的辩论可能很有趣,但看到人们关注的是人们需要解决的实际问题,而不是关于纯技术的抽象辩论,这让人耳目一新。是什么推动了这种变化?归根结底,它是由现实所驱动的。为了充分发挥noSQL平台的潜力,它们需要集成到组织的更广泛的数据策略和基础设施中,而不仅仅是作为一个孤立的项目留给一小部分懂MapReduce、Scala、分布式并行编程和Hadoop操作的技术专家来访问或限制。将这些系统集成到数据基础设施中比查询语言是否是SQL要广泛得多。这些需求通常为数据仓库项目所熟悉,包括:如何使数据对当前的工具和用户可用(顺便说一句,许多工具和用户讲SQL)如何创建和管理元数据您如何规划和部署满足需求所需的容量和马力如何优化性能和规模你怎么处理安全问题并确保数据的可用性以及如何监控数据当人们开始尝试构建Hadoop数据仓库或Spark数据仓库时,这种方法的巨大复杂性的现实开始变得显而易见。将所有需要满足关键要求的不同部件缝合在一起需要大量的胶带、钢丝绳和弯头润滑脂。仅仅弄清楚如何支持对数据的健壮SQL访问是一项非常重要的任务,更不用说研究如何围绕它们构建安全性、可用性和操作框架及流程。事实上,这是一个很大的时间,努力和分心,最终只是试图重建一个车轮,特别是由雪花。除非您的核心业务专长是构建大型、企业级的分布式数据库平台,否则尝试自己构建它不是正确的选择。取而代之的是,利用数据仓库这一由顶尖专家创建的服务,让您专注于您的核心专业知识和差异所在。如果您的核心专业知识是了解您的数据以及如何分析数据,那么您可以将重点放在使用Hadoop或Spark进行专门的算法和机器学习,同时将其与处理报告、分析等的数据仓库服务相结合,则您可以更快、更简单地了解整个组织的数据。例如Spark+一个弹性数据仓库昨天在Strata的一次会议上,有一个很好的例子说明了这种方法。Celtra生产软件,帮助公司创建引人注目的数字广告内容,他谈到了数据管道随着时间的推移而演变的过程。与许多成长中的公司一样,它们的增长速度超过了最初的数据管道实现,需要改变。他们开始使用Spark来帮助他们转换从mySQL数据库输入仪表盘、即席查询和应用程序的跟踪事件数据。然而,他们需要改进他们的方法来简化他们的开发周期,加快实验速度。在调查了许多可能的路线之后,Celtra意识到他们需要类似数据仓库的东西来支持他们的许多需求。这使得Celtra将Spark与Snowflake的弹性数据仓库结合在一起,他们现在拥有了一个数据管道,可以在Spark中创建复杂的自定义数据处理,同时也支持整个公司的报告和分析用户的需求。通过一起使用,他们获得了SQL和noSQL这两个世界的优点。请继续关注未来的网络直播,届时Celtra将分享更多关于他们所做的以及为什么这是满足他们需求的正确解决方案。附加链接数据仓库:SQL和NoSQL有什么区别?SQL定义:雪花词汇表就像你读的?通过喜欢和分享来表达你的感激之情!Facebook推特LinkedIn

猜你喜欢

微信公众号