Hive源码解析—之—Hive的入口:
Hive源码解析—之—hive的入口:
SQL是OO的吗?
如何获取hive建表语句
在使用hive进行开发时,我们往往需要获得一个已存在hive表的建表语句(DDL),然而hive本身并没有提供这样一个工具。
写好Hive 程序的五个提示
使用Hive可以高效而又快速地编写复杂的MapReduce查询逻辑。但是某些情况下,因为不熟悉数据特性,或没有遵循Hive的优化约定,Hive计算任务会变得非常低效,甚至无法得到结果。一个”好”的Hive程序仍然需要对Hive运行机制有深入的了解。 有一些大家比较熟悉的优化约定包括:Join中需要将大表写在靠右的位置;尽量使用UDF而不是transfrom……诸如此类。下面讨论5个性能和逻辑相关的问题,帮助你写出更好的Hive程序。
Hive 随谈(六)– Hive 的扩展特性
Hive 是一个很开放的系统,很多内容都支持用户定制,包括: 文件格式:Text File,Sequence File 内存中的数据格式: Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本:不管什么语言,利用 stdin/stdout 传输数据 用户自定义函数: Substr, Trim, 1 – 1 用户自定义聚合函数: Sum, Average…… n – 1 File Format TextFile SequenceFIle RCFFile Data type Text Only Text/Binary Text/Binary Internal Storage Order Row-based Row-based Column-based Compression File Based Block Based Block Based Splitable YES YES YES
Hive 随谈(五)– Hive 优化
Hive 针对不同的查询进行了优化,优化可以通过配置进行控制,本文将介绍部分优化的策略以及优化控制选项。
Hive 随谈(四)– Hive QL
Hive 的官方文档中对查询语言有了很详细的描述,请参考:http://wiki.apache.org/hadoop/Hive/LanguageManual ,本文的内容大部分翻译自该页面,期间加入了一些在使用过程中需要注意到的事项。
Hive 随谈(三)– Hive 和数据库的异同
摘要:由于 Hive 采用了 SQL 的查询语言 HQL,因此很容易将 Hive 理解为数据库。其实
从结构上来看,Hive 和数据库除了拥有类似的查询语言,再无类似之处。本文将
从多个方面来阐述 Hive 和数据库的差异。数据库可以用在 Online 的应用中,但是
Hive 是为数据仓库而设计的,清楚这一点,有助于从应用角度理解 Hive 的特性。
Hive 随谈(二)– Hive 结构
本文介绍了 Hive 的体系结构,元数据管理方式以及数据的管理方式

近期评论