推荐序
张帜是我的学长,也是我数十年的挚友,更是一位不断创新进取的名副其实的技术控。从当年为金山公司研制出具有划时代意义的国内首款全套曲线汉字技术,到现在潜心研究提升最前沿的图数据库的效能,一直游刃于信息科技的前瞻地带,在所有致力投身的每一个研究领域都有独到的创新和贡献。
图数据库是基于图论实现的新型数据库,擅长于处理点和边组成的复杂关系网络,执行效率远超传统数据库。在大步快跑的大数据时代,图数据库的应用将大有可为。如果将大数据应用比作一架高速航行的飞机,数据库就好比飞机的核心动力引擎,那么图数据库就是新一代高效、省油的大推力引擎。可以预见,图数据库在大数据领域将凭借其理论优势和性能超前,在复杂关系处理上逐步取代传统的关系数据库,支撑大数据技术的飞跃发展。
同时借此机会,祝愿本书的读者能从书中汲取新思路、新知识、新技能,应用于各自研究领域,在大数据时代一展宏图。
求伯君,WPS创始人
互联网、数据和计算逐渐被认为是驱动时代发展与社会进步的“三大引擎”。诚然,互联网已成为信息社会的基础设施,数据被视为世界的新资源、新财富,计算逐渐转化为公共服务。如何高效、便捷地存储、建模、应用数据,为计算提供支撑,并能适应互联网新思维,无疑已成为政商学界关注的焦点。
当今世界精彩纷呈,既需要市场引领者的开拓,还需要独立思考者的洞见。张帜先生作为国内图数据库布道的第一人,俨然成为这类少数思考者的杰出代表。图数据库以图论为其理论基础,完全超越了传统关系数据库在集合论之上建立的关系代数范畴,可线性扩展并有效支撑上千亿个节点和关系巨型图的存储及复杂关系分析,将在金融、社交、传媒等诸多领域点燃革命性的“星星之火”!
张帜先生主编的这本《Neo4j权威指南》将填补中国原创图数据库书籍的空白,它将带您在图数据库的海洋里遨游,特别会在复杂关系分析与挖掘领域助您一臂之力!
周鸿祎,360公司创始人、董事长兼CEO
张帜先生与我着实有缘,1977年恢复高考后第一批考入国防科技大学数学师资班,1979年又一同转到钱学森提议创办的国内首个信息系统工程专业。时间飞逝,转眼间已入花甲之年,忆往昔,虽小有成就;展未来,仍激情澎湃!
如今俨然迈入了大数据时代,数据无疑成为21世纪各国争先开拓的新边疆,如何高效、便捷、直观地处理海量、快速、多样的数据,并能挖掘出其中纷繁复杂的关系,必为各国及各行各业抢占的制高点。张帜先生近年来潜心研究的图数据库,它是以数学中图论为理论根基,用节点和关系所组成的图为真实世界直观建模,支持百亿乃至千亿量级规模的巨型图的高效关系运算,势必将成为我们这个时代一颗璀璨的明珠!
本书为图数据库系列丛书的开篇力作,重点介绍全球图数据库市场占有率第一的Neo4j。大数据、图数据库爱好者们,你一定值得拥有!
胡晓峰,国防大学教授、博士生导师,中国仿真学会副理事长
从简单的传音达意到弹唱相和,语言经过了几十万年的演化才有了音乐;从朴拙的刻画符号到小说诗歌,文字经过了几千年的演绎才形成了文学。这本书让大家看到先进的科学技术如何在几十年间让冰冷的数据绽放出不亚于音乐和文学的美。
周涛博士,电子科技大学
The technology world is changing. We have awoken to the fact that relationships are where true value lies in data. Powered by this awareness we have seen the large Web companies - Facebook, Google, LinkedIn, eBay to name but a few - deploy graph technology to devastating advantage. By using graphs they have become the dominant players in their domains and displaced legacy competitors who once seemed unassailable.
The technology that has given these Web giants their key advantage is no longer their sole provenance. The arrival of Neo4j - the first and leading graph database - allows enterprises and startups alike to deploy graph technology like those Web giants.
Neo4j is the product of over 10 years of continuous research and development, pioneers of the property graph model, and the de facto standard in graph databases. It allows users to store complex networks information (called graphs) that model the real world in high fidelity. Those graphs can be queried by a sophisticated graph query language called "Cypher" which provides the basis for gaining insight into the connected data.
Not only does Neo4j make working with graph data simple and even pleasurable, it is also very efficient and performant. A single core can handle queries that traverse several million relationships per second. Even modest clusters of Neo4j servers can support applications with hundreds of millions of users and a billion transactions per day. The kinds of applications that will drive the next wave of innovation in China and globally
This book marks an important milestone. The Chinese development community is rapidly embracing graphs to leapfrog technical limitations in legacy technology and command competitive advantage. This book is the first to be written by the Chinese community for the Chinese community by real Neo4j experts. It will provide the reader with a thorough understanding of how to deploy graphs and Neo4j.
The future of Neo4j is one full of innovation and possibility. I hope this book helps you to become a part of that future, and I wish you good fortune in your graph journey.
Dr. Jim Webber, Chief Scientist at Neo4j
技术在不断变革!当我们刚刚意识到数据的真正价值是在于其关系时,却看到全球网络巨头们(如Facebook、Google、LinkedIn、eBay等)已悄然将图数据库这一技术转化成了自己的优势,并利用这一优势,逐渐超越了曾经旗鼓相当的竞争对手,从而确立了其在各自领域中的统治地位。
赋予这些网络巨头们核心竞争优势的图数据库技术,如今已不由这些网络巨头们所独有。随着Neo4j(全球第一,也是全球领先的图数据库)的到来,使得所有企业都能像这些网络巨头们一样去部署自己的图数据库。
十余年持续的研发,使得Neo4j产品成为图模型的先驱,也成为图数据库行业事实上的标准,它能让用户以高度精确的方式来存储现实世界中的各种复杂的网络关系(也称之为图),并通过名为Cypher的精准语言来对图进行查询,从而洞悉数据间的关联关系。
Neo4j不仅简化了图数据的处理,而且极为高效,同时还能带来种种乐趣。一枚单核处理单元就能在每秒处理超过百万级的关系查询,即使是最基本的Neo4j服务器集群部署,也能支持数亿用户或每天超过十亿次交易的应用,从而推动中国乃至全球的下一波创新潮。
此书标志着一个重要的里程碑。中国正飞速拥抱着图技术所带来的机遇,从而跨越传统技术的限制以获取最新的竞争优势。这是第一本由中国的Neo4j专家团队为中国开发群体所撰写的著作,它将帮助广大读者全面了解图模型以及如何部署和使用Neo4j。
Neo4j的未来充满着创新及各种可能性,我也衷心希望此书能让您成为Neo4j未来的一部分,愿您在图的旅途中一切顺利!
Jim Webber博士,Neo4j首席科学家(文)
邬瑞文,微云数聚首席商务官(译)
近几年,“大数据”一词逐渐成为政界、学界、商界、媒界热议的焦点,也因为大数据的不断应用和发展,使我们所有人的生活都在发生着潜移默化的改变,无论你是否相信,大数据时代已经来了!
在大数据时代,我们每天每时每刻都要主动或被动地接收大量信息。我们需要知道在这些信息之间都流动着怎样的关系,理清这些关系又会给我们的生活带来怎样的便利。这就有必要依靠一项新的技术——图数据库,而一提到这项技术就不得不说,中国图数据库技术第一人张帜老师。
虽然与张帜老师相识时间不长,可从刚认识他开始,就一直被他那种对技术执着追求的精神所感染。他曾有过很多身份和标签:老师、军人、技术专家等,从大学到部队,从部队到外企,虽然他的身份跟随时代的音符在变,但对于技术的钻研几十年来从未有变。这本书里有很多内容是他长期研究和实践的心血,同时也有一些同道中人在图数据库应用中所阐述的真知灼见!
我相信本书的问世不仅会给很多大数据行业从业者带来启发,同时也会给很多对图数据库技术感兴趣的年轻人打开一扇科学的大门。
梅正忠,CCTV证券资讯频道制片主任
第一次巧遇张帜老师是在杭州的梅家坞品茗,他一谈起图数据库就眉飞色舞、眼睛发亮,围绕着张老师的听众无一不被他身上的“图控”气息所感染,同时也被图数据库高效的搜索、酷炫的功能所吸引……前不久,戴尔中国团队的珠海年会就特邀张帜老师做了图数据库专题讲座;图数据库带给人的应用体验是震撼的。
其实,仔细想来不仅戴尔公司在各行各业的客户对这一项新技术需求强烈,戴尔自身的内部管理也有大量的应用场景,比如对第三方供应商的管理、对客户ID和funnel的管理等,很多应用都可以利用图数据库进行大幅度优化,一些不可能实现的功能也能因此得以实现,这让我们惊喜地看到了一种全新的技术前景,并重新审视我们的业务。
张帜老师主编的这本权威教材,将带你走入图数据库的奇妙世界。学习图数据库、掌握图数据库,进而应用图数据库!
Shirley Wu, VP, Dell China
缘起本书作者之一李敏博士的倾力推荐,张帜老师为国统·首页大数据的小伙伴热情介绍了图数据库及其应用,并表示愿意作为首页大数据一分子,号召业界同仁共同为国家大数据应用发展贡献力量,这种不忘初心的意志,更坚定了我们继续努力实现领军国内大数据研究应用的第一旗帜的家国情怀。
该经历的已经经历,该享有的业已享有,花甲之人本当退休养老,张帜老师却选择了继续创业,这并不简单,耗时费力,还有可能不会那么成功;但张帜老师热情洋溢,像一个充满梦想的小孩挥霍自己的青春一样为Neo4j国产化事业挥霍余生。
《Neo4j权威指南》浓缩了张帜老师的梦想和追求,它会让从业者快速地掌握Neo4j之美,用新思维、新技术促进人类与数据的交互,提供高质量的服务。
相信国统·首页大数据在推动国家大数据池建设、一带一路大数据应用和地方大数据发展进程中,张帜老师及图数据库技术必将发挥重要的作用。
江青,中国统计信息服务中心(CSISC)大数据研究实验室主任
国统·首页大数据主任,中国统计信息咨询中心执行主任
人的本质是一切社会关系的总和——对于媒体而言,每一次报道都需要挖掘、揭示或串联起各种曲折的、隐秘的或是被忽略的关系,图数据库技术显然为此打开了一个巨大的想象空间。
第一次看到张帜老师展示的图数据库案例,蛛网般的复杂关系被轻松抽解,任一节点都可如魔盒般开启扩展,的确妙趣横生。不过,图数据库的功效还远不止这些。事实上,在传统媒体转型的沉重命题面前,大数据技术已被视作拉动这一重轭的关键引擎,为用户画像,重建失效的用户连接,研发基于数据分析的内容产品模式,都被寄予厚望。而受制于对技术的理解,大数据很多时候仍被简单而抽象地对待,不少媒体仅仅完成了数字化,距离数据化道阻且路长却毫不自知,同时对于自己领域内可触及、可获得的数据资源,仍然不够敏感。
在听张帜老师讲解图数据库时,最直接的感受是,在新技术的酷炫背后,传统媒体需要踏踏实实、不畏艰苦地去做数据基础建设,目标和标准由新技术决定,但这种苦功夫甚至笨功夫却是不可或缺的,不可能指望一键到位。内容生产者正是在这个过程中,才能真正理解从内容到数据的演化逻辑,也才能真正建立起数据思维,从而实现生产方式的转型、实现自己在这个时代的价值。
程瑛,新华社《财经国家周刊》常务副总编辑,瞭望智库副总裁
很少看一本讲述信息技术与大数据的书籍会这么专心。我相信,如果不是一个将信息技术与大数据研究实践做得极为贯通的人,是绝不会把如此专业的内容写得这么“深入浅出”。
作为报业的一员,我们在全媒体融合的道路上可谓是战战兢兢,在选用网站采编发系统及大数据智能推荐系统时,张帜老师所讲述的图数据库系统和可视化的关系数据模型带给我极大的启发,让我们在转型互联网的道路上有了可以借鉴与学习的便捷之路。
真心希望和我们一样探索的媒体人,能找到这个向导直达自己转型的彼岸。
刘亚利,政府采购信息报社创办社长,政府采购信息网总裁
什么是图数据库、有什么用、与我的工作有何关系?相信第一次接触的人都会提出这种或那种的疑问。但是,如果您是从事大数据技术和应用的相关人士,就应该对这种前沿性技术有着敏锐的嗅觉。
本书告诉我们,图数据库是大数据时代下新型的数据库系统,是基于图论实现的、专门处理复杂关系的数据库系统。当前,数字经济、数字化转型、智慧城市、智能制造和大数据应用等热点问题,这些都无不与信息技术的发展密切相关,本书的面世,为该领域新增了一本兼具深厚理论基础和实用价值的专著。
以我的工作背景而言,认为当前和今后一段时期,数字化转型对企业转型升级、构建新型信息化、推进“两化深度融合”等工作,都具有十分重要的意义,故愿意积极向同行们推荐本书。本书主要作者张帜先生,作为中国图数据库研究的先导者,能够及时联合一批专家学者为我们呈现出这样一本专著,令人敬佩。相信这本书凝聚了他与同道者的最新研究成果和智慧,一定会对CTO、CDO和CIO们未来的工作有所帮助和启发。
李红,中国中钢集团公司信息管理中心总经理
关系型数据库难以解决数据之间的关系!这是困扰大数据专家多年的难题。现在大数据行业需要处理的数据之间的复杂关系随数据量的增长呈几何级数增加,已经到了必须找到一种突破性技术加以解决的时候。
2015年我组建中国首席数据官联盟时,有幸邀请到中国IT界前辈张帜老师担任数据挖掘专委会秘书长。正是由于张帜老师的前瞻性技术思路使我看到了图数据库高效分析处理复杂关系、取代关系型数据库的希望。
图数据库以图论为数学基础,对复杂关系的处理效率可达到传统数据库的千万倍,将很快应用到政府、金融、能源、制造业、军事和航空等各个领域。使我们仅仅通过数据库升级就能让现有计算能力得到成千上万倍的提升,节约大量计算资源和能耗。
感谢张帜老师为中国大数据产业发展做出的巨大贡献!
刘冬冬,中国首席数据官联盟创始人
当下是社交网络和物联网爆炸的大数据时代。这个时代的一个重要的特征,就是人与人、物与物、人与物之间的关系图谱。图数据库,是处理这种关系最合适的软件技术。张帜老师,则是研究、普及、传播和推广这一技术的权威专家。
深入到任何一个领域,我们都会发现,权威专家不少。在传播知识的过程中,后学者往往缺少的是能够用简单易懂的语言把晦涩难懂的理论讲述清楚的技能。张帜老师无疑是这一类专家中的佼佼者。
在中国Hadoop大数据峰会这个历经9年以专业、专注和开放分享为特点的亚太地区顶级大数据峰会上,张帜老师的关于图数据库的演讲获得了超级热烈的欢迎和成功。他的经历传奇且励志;他的讲解清晰且详尽;他的语言坚实且极具感染力。张帜老师以他的个人魅力和对图数据库的热情、理解和把握,打动了现场上千名观众。在演讲的过程中,掌声热烈而持续,气氛活跃而有序。张帜老师的演讲,是历届最受欢迎的演讲之一。
兴趣是学习路上最好的老师。相信张帜老师的这本关于图数据库的书,不仅能够给读者带来图数据库的知识,还能带来对图数据库的兴趣,更能带来非常愉快的学习体验!
何建军,中国Hadoop峰会主席
中生代技术社群到今年3月份刚好成立一周年,在这一年的时间里坚持做了近60期的免费在线分享活动,在这么多的老师中,张帜老师无疑是让我们触动最大的老师之一。时间是在今年3月份,我们很荣幸地邀请到了张帜老师做中生代技术第57期在线分享节目,分享的内容是《图数据库Neo4j的应用》。
在组织这次分享之前对张帜老师的了解仅仅停留在央视采访视频和分享的技术文章上,考虑到张帜老师是德高望重的前辈,而我们组织的线上分享是很新颖的在线文字+语音互动交流的方式,使用的平台也是张帜老师第一次使用的“微课帮”平台,所以很担心张帜老师会不适应。但没想到的是,在我们和张帜老师第一次简单沟通流程以后,张帜老师就自己开始独立注册并摸索这个陌生的平台,并且很快就熟悉了这个平台,还给我们提出了不少对流程和产品的意见。从这一点就能发现张帜老师对任何新事物新技术都极富有探索欲望和实践精神。
在线分享中,张帜老师为在线的几百名同学展示了图数据库强大的功能,图数据作为最能直接地反映真实世界属性和关系的数据库,建模简单,性能强劲,搜索功能丰富,扩展性强。张帜老师为我们开启了一扇通向图数据库技术的窗户。中生代的宗旨也是致力于传播前辈的技术精神,发展中生代的技术实力,挖掘新生代的技术潜力。张帜老师这种执着追求技术、无私的分享精神,为我们后辈们树立了学习的榜样。
张帜老师的新书即将问世,希望更多技术人通过这本书深入了解到张帜老师多年潜心研究的图数据库技术,把图数据库技术应用到更多的场景中,发挥出更大的价值。
王超,京东金融技术专家,中生代技术社群组织者
大数据产业发展至今,有两个核心理念越来越重要,即“融合”和“跨界”。“融合”指的是不同数据要在身份、时间、空间等维度上打通,并相互之间发生化学反应,如此可以指数级提升数据的价值,这在用户数据、企业数据等层面表现得尤为突出;“跨界”指的是数据不要预设领域限制,实践中数据跨界到非来源领域的价值更突出,比如交通出行数据跨界到保险和金融领域则会为其带来意想不到的价值。“融合”本质上体现的是数据之间的关联,这就需要一套机制来表现,容纳数据本身及其关联。这时候图数据库就是一个非常好的选择。“跨界”本质上体现的是在融合后的数据上,辅以行业信息,对其进行深度发掘,得出支撑行业决策的结论。这时候也需要一套机制来支撑我们在融合后的数据上进行各种身份、时间、空间下的复杂高效的计算与推理,图数据库依然能给予很好的支撑。这本书恰逢大数据阶段发展需要。
齐红威,数据堂(北京)科技股份有限公司董事长
张帜老师是中国IT界元老、中国图数据库先导者、大数据领域资深专家,是我公司众多来自国防科技大学核心团队成员的老学长、好朋友。其在国内致力推广的图数据库被大家称为大数据时代的高铁,也越来越受到人们的关注。图数据库,不单单是处理图,它全方位地让互联网更便利了我们的生活。
在网智天元提供大数据智能处理与价值变现的整体价值链解决方案中,一项重要的工作是挖掘资源对象的要素实体,以及发现实体间的关联。图数据库因其自身的特色非常符合我们的业务需求和技术路线,在文化大数据和金融大数据两个领域能发挥巨大的作用,为知识本体构建、关联挖掘和展示提供了工具和基础。
本次的新书问世,将让更多的读者通过这本书深入了解到张帜老师多年钻研的图数据库技术及其广泛的应用场景,衷心期待张帜老师和他创办的微云数聚能在大数据时代大显身手。
蔡锦森,网智天元总裁
张帜老师作为国内毋庸置疑的IT元老,不仅一直战斗在技术一线,而且无私地提携了许多后辈和新人。张老师还是国内首屈一指的大数据专家,他很早就洞察到了图数据库在大数据应用中将会发挥巨大的价值和能量,于是致力于图数据库在国内的应用和推广。张老师不仅亲自对Neo4j进行汉化,还举办了形式多样的系列讲座和活动,让更多人了解Neo4j及其应用。
作为国内最早的大数据践行者,百分点从2013年便开始研究Neo4j,并且应用到了用户拉通、知识图谱、关联关系分析、数据治理等许多产品和应用场景上。从2016年起,百分点和张帜老师进行了多次交流,探讨图数据库技术以及相关的大数据应用。张老师的专业、专注和热情让百分点的技术人员深受感动、受益匪浅。
本书是张老师和团队在Neo4j和图数据库方面理论和经验的凝结。一如张老师认真实干的态度,本书不仅介绍了Neo4j的基础和程序开发,更涉及它的管理、运维和应用实战,可以说干货满满、诚意十足。我希望有更多的技术人员可以通过阅读本书全方位了解Neo4j,了解图数据库,了解大数据应用,推动大数据在中国的落地应用。
祝大家阅读愉快!
苏萌,百分点集团董事长、CEO
从行存、列存、键值对数据库,再到图数据库,人们对高效处理海量数据的追求从未止步。Neo4j作为近年来图数据库的杰出代表,为我们处理复杂关系数据开启了一扇明窗。
数字冰雹的业务定位于数据可视化系统开发,其中数据对象间复杂关系的表达,是非常重要的一个领域;而传统侧重于表处理的数据库,在计算和查找不同数据实体间的大量关系方面,效率很难让人满意。我们也因此认识和了解到了Neo4j,更有幸结识了张帜老师。
张帜老师人如其名,跟他坐在一起谈论技术,我仿佛能看到一面迎风招展的旗帜。虽然年近花甲,但只要一提起图数据库,他立刻就满腔沸腾,让人深感其睿智,敬意油然而生。
本书的出版是中国图数据库发展的重要里程碑,可以说是恰逢其时。我们非常喜欢Neo4j,也非常愿意凝聚在这样的旗帜之下。
邓潇,数字冰雹总经理
我们已经进入到大数据时代,互联网数据是其重要构成部分,其中,社交关系的复杂性为数据的表示和存储都带来了极大的挑战。为了表达这些关系,并且能够进行快速查询,分析计算、数据挖掘和图数据库技术将大有用武之地。Neo4j是目前在图数据库技术中使用最为广泛的一个产品,智慧星光已经在项目中开始使用Neo4j,比如企业邮件系统分析、情报分析、社交媒体数据挖掘等。
张老师带领团队正在做的Neo4j研发工作,不是一个单纯的汉化工作,更是对产品的进一步开发和优化,将会在图数据库市场上占有重要的地位。基于这个团队对产品和技术的深刻了解,这本《Neo4j权威指南》也将成为Neo4j的初学者和专业人员的案头宝典。
白剑波,北京智慧星光信息技术有限公司总经理
我们生活在复杂现象的梦幻中,图是直观表达复杂现象的工具,图数据库技术是透过复杂现象直接达成深刻洞察的利器,可以使洞察更加便捷。
曹洁,中基凌云董事长
初见张老师是在首席数据官联盟的一次会议上,老师谈起“图数据库”时似火的热情,执着的劲头以及专业的精神,深深地打动了我。我一直从事图计算引擎方面的研发,苦于没有太多前辈提点,真恰有一种相见恨晚的感觉,因此一直尊称“老师”。
从多年大数据的研发实践来看,纷杂数据中产生洞察之根本在于关联,以及多次关联。这恰恰是传统关系数据库无法胜任的“痛点”。Neo4j等一系列图数据库和图计算工具的诞生,正好可以针对这种类型的数据和关联分析提供更为优秀的解决方案。
张帜老师带领一帮技术高手联袂打造的图数据库系列书籍,无疑为从事大数据分析的技术人员开启了一扇新的大门,将成为数据挖掘必备的“秘籍宝典”。
王绪刚,中科金审CTO