想咨詢您一個關(guān)于多維統(tǒng)計的解決方案~
我們公司每天日志2G 左右,日志條數(shù)300W左右~
在做數(shù)據(jù)統(tǒng)計時,如果粒度太細,數(shù)據(jù)量就會很大,查詢的維度也相對比較固定~查詢速度也會隨著數(shù)據(jù)增加而變慢~
需求是希望在web端,可以即時搜索,不同維度,顯示不同的報表~
如:品牌、型號、地區(qū)、運營商~
時間:日、周、月、季度、年
可能按照品牌+機型、地區(qū),品牌+運營商,品牌+地區(qū)、運營商等等+時間 隨意組合。
看到網(wǎng)絡(luò)上有OLAP等相關(guān)方案,但是都和大數(shù)據(jù)有關(guān),我覺得現(xiàn)在這個數(shù)據(jù)量級還達不到大數(shù)據(jù)那個層次吧~~
有什么好的建議方案 或者 相關(guān)的研究資料呢?
一天 300W ,一周 2000W ,一個月 1億,一年是 10 億級別的,還是算大了。(當然,如果你的指標維度,只有你列出的那么一點,那數(shù)據(jù)還是很簡單的)
MySQL 就別想了,不光它,任何通用的關(guān)系型數(shù)據(jù)庫都別想了。
并且,通用數(shù)據(jù)模型層面的(即指望一套方案,在不人為針對性設(shè)計的情況下,直接解決所有數(shù)據(jù)存儲的問題),就不要想著去解決了。(真不是你們能解決的問題)
針對具體“事實”下的數(shù)據(jù),專門做一些存儲的設(shè)計,要解決還是有可能的。
功能好點的方案,我知道有 2 個,一個是基于 Postgresql 的 Greenplum ,另一個是 yandex 開源出來的 Clickhouse。
前段時間我看 ClickHouse 的東西寫在 https://www.zouyesheng.com/cl... 。
另外還有一個思路,就是靠 HBase 這種,窮舉維度預(yù)處理計算,靠空間換時間。不過這種方案,在應(yīng)用層上不太好設(shè)計,對 SQL 的基本支持都是一個挑戰(zhàn)。
北大青鳥APTECH成立于1999年。依托北京大學優(yōu)質(zhì)雄厚的教育資源和背景,秉承“教育改變生活”的發(fā)展理念,致力于培養(yǎng)中國IT技能型緊缺人才,是大數(shù)據(jù)專業(yè)的國家
北大青鳥中博軟件學院創(chuàng)立于2003年,作為華東區(qū)著名互聯(lián)網(wǎng)學院和江蘇省首批服務(wù)外包人才培訓基地,中博成功培育了近30000名軟件工程師走向高薪崗位,合作企業(yè)超4
中公教育集團創(chuàng)建于1999年,經(jīng)過二十年潛心發(fā)展,已由一家北大畢業(yè)生自主創(chuàng)業(yè)的信息技術(shù)與教育服務(wù)機構(gòu),發(fā)展為教育服務(wù)業(yè)的綜合性企業(yè)集團,成為集合面授教學培訓、網(wǎng)
達內(nèi)教育集團成立于2002年,是一家由留學海歸創(chuàng)辦的高端職業(yè)教育培訓機構(gòu),是中國一站式人才培養(yǎng)平臺、一站式人才輸送平臺。2014年4月3日在美國成功上市,融資1
曾工作于聯(lián)想擔任系統(tǒng)開發(fā)工程師,曾在博彥科技股份有限公司擔任項目經(jīng)理從事移動互聯(lián)網(wǎng)管理及研發(fā)工作,曾創(chuàng)辦藍懿科技有限責任公司從事總經(jīng)理職務(wù)負責iOS教學及管理工作。
浪潮集團項目經(jīng)理。精通Java與.NET 技術(shù), 熟練的跨平臺面向?qū)ο箝_發(fā)經(jīng)驗,技術(shù)功底深厚。 授課風格 授課風格清新自然、條理清晰、主次分明、重點難點突出、引人入勝。
精通HTML5和CSS3;Javascript及主流js庫,具有快速界面開發(fā)的能力,對瀏覽器兼容性、前端性能優(yōu)化等有深入理解。精通網(wǎng)頁制作和網(wǎng)頁游戲開發(fā)。
具有10 年的Java 企業(yè)應(yīng)用開發(fā)經(jīng)驗。曾經(jīng)歷任德國Software AG 技術(shù)顧問,美國Dachieve 系統(tǒng)架構(gòu)師,美國AngelEngineers Inc. 系統(tǒng)架構(gòu)師。