專案

3/14ページ

快速冪取模演算法詳解

1.大數模冪運算的缺陷: 快速冪取模演算法的引入是從大數的小數取模的樸素演算法的侷限性所提出的,在樸素的方法中我們計算一個數比如5^1003%31是非常消耗我們的計算資源的,在整個計算過程中最麻煩的就是我們的5^1003這個過程 缺點1:在我們在之後計算指數的過程中,計算的數字不都拿得增大,非常的佔 […]

top10熱門品類之需求以及實現思路分析

一、 需求:top10熱門品類 計算出來通過篩選條件的那些session,他們訪問過的所有品類(點選、下單、支付),按照各個品類的點選、下單和支付次數,降序排序,獲取前10個品類,也就是篩選條件下的那一批session的top10熱門品類; 點選、下單和支付次數:優先按照點選次數排序、如果點選次數相 […]

獲取top10品類的點選次數最多的10個session

一、需求: 獲取top10品類的點選次數最多的10個session top10熱門品類, 獲取每個品類點選次數最多的10個session, 以及對應的訪問明細 二、實現思路分析: 2.1、拿到符合篩選條件的session的明細資料, 提取成公共的RDD /** * 通過篩選條件的RDD與明細資料進行 […]

機器學習安然資料集分析報告

專案背景 安然曾是 2000 年美國最大的公司之一。輝煌時期,市值高達700億美元。2002 年,由於其存在大量的企業欺詐行為,這個昔日的大集團以極快的速度土崩瓦解。 在隨後聯邦進行的調查過程中,大量有代表性的保密資訊進入了公眾的視線,包括成千上萬涉及高管的郵件和詳細的財務資料。 你將在此專案中扮演 […]