2014年2月26日 星期三

Calculation of K-mean Clustering

  1. Original K-means Clustering

    Suppose m1 is the mean of cluster 1 which has data points x1, x2, x3 and x4.
    Suppose mis the mean of cluster 2 which has data points x5, x6, x7, x8 and x9.



    There are some disadvantages of the original k-means clustering. First, it is possible that no data points assigned to the cluster with the initial mean in a bad initial guess. Second, the value of k(number of the data points) is not user-friendly because we don't know the number of clusters before we want to find clusters. Comparing to sequential k-means clustering, original k-means clustering is time-consuming. Try to imagine that if you want to add only one data point, how many data points you should have?  The answers is you need all the values of data points.
      
  2. Sequential K-means Clustering


    m1(left-hand side) = Updated mean of cluster 1
    m1(right-hand side) = Original mean of cluster 1
    n= Number of data points in cluster 1
    x = new data point


      
  3. Forgetful Sequential K-means Clustering


    mi(left-hand side) = Updated mean of cluster i
    mi(right-hand side) = Original mean of cluster i
    x= Number of data points in cluster i
    a = assigned weight, eg. 0.8



    Based on the above three calculations, you can get that the weight of x (i.e.data point) decreases exponentially with the "age" to the example. Moreover, a new formula can be derived from the above example.

    xj = the first j-th example in i
    mj = the mean vector of cluster i after the first j-th examples are added

2014年2月21日 星期五

從不知天高地厚

過往的我並不知道為什麼人們喜歡行山,更驚訝為甚麼行山也可當作運動。直到最近我登上茅湖仔山,飽覽將軍澳景色,我的心態也開始改變。

登茅湖仔山是一項非常講求腳骨力的活動,山坡斜度高而且樓梯少,在寧靜的道路上,旁邊的叢林亦常常發出枝葉被擦過的聲音,我曾擔心會否是野豬或猴子在活動,直到看到鳥影才定下心來。我緩緩而行,身體亦慢慢地在寒風中熱起來,而且也開始喘氣。我詫異為甚麼我的身體這麼差,平日我在大街小巷上步行半小時也不會喘氣。

當到達茅湖仔村村口,我從那裡旁邊的一塊地欣賞將軍澳的景色,那層次井然的樓宇被高高的山脈圍繞著,新建的單車館像是個皇冠被放置在眾樓宇中間,我也看到我房間的窗口,那個畫面就像將整個將軍澳放進一個大碗內,而我則站在碗邊上看。從山上看到的市區景與在飛機或纜車上看到的截然不同,在山上欣賞可以置身感受到景色的震撼,亦可慢慢欣賞這幅美麗圖畫上的每點小像素,我不但感受到急速的城市在我眼中停下來,而且心情也放鬆了。

我喜歡行山,喜歡那種從高處俯看我們熟悉的地方的感覺,喜歡用另外一個角度去闡釋這個地方,喜歡讓自己的身心靈得到放鬆。

本文曾於2014年1月28日刊登於《明報》副刊自由談

2014年2月16日 星期日

備戰渣打馬拉松

現今距離渣打馬拉松開跑尚餘十日左右,相信不少跑手都會像我這樣臨陣磨槍,縱使為時已晚,難以跑出好成績,亦希望短期的訓練能助我跑出預期的時間。

早在去年十二月,我打算於學校考試完結後進行地獄式訓練,為出戰渣打馬拉松作好準備,可是人總有惰性,即使有逾一個月的假期,我仍懶洋洋的在家中上網和看電影,做盡宅男會做的事情,練習亦只有數次,每次也只有五公里左右,這種優游的生活模式亦成為了我比賽的危機。

對我來說,寒冷的氣候是我最大的絆腳石,每當我想到我的手指被寒風吹到僵硬,耳朵被吹至疼痛,我都對自己說「明天才練習吧!還有時間!」亦正正是因為這種的心態,我能夠很優閒地渡過 我的假期,但時至今日,我亦開始後悔。

近日,我加緊練習,以亡羊補牢,並為自己設立明確的目標時間,我刻意於晚上出發,以適應比賽時那種昏暗的低溫環境,選擇的路線是從將軍澳市中心來回跑至電視廣播城,途中有上有落,長度約十公里,與比賽路線相似。訓練體能只是其次,更重要的是想培養堅定的意志,冷風的吹襲和疲倦的身體亦曾令我想放棄,但我跟自己說「連十公里也挨不住,將來也難成大事」,也因如此,我亦堅持到底,直至跑完整條路線才停下腳步。

我相信這亦是我練習長跑學習到的精神──堅持不懈

2014年2月11日 星期二

歸納推理 Inductive Reasoning

  1. 歸納推廣 Inductive Generalizations

    由一個群體中的樣本具有某種性質,而推論出整個羣體的某個百分比也具有該性質。
    We are making a generalization if we conclude a claim about a group, the population, from a claim about some part of it, the sample.
      
  2. 統計論證 Statistical Arguments

    統計論證從前提中有關樣本或群體的百分比作出結論,而這個結論是有關群體中的一個獨立的成員或部分的成員。
    A statistical argument argues from premises regarding a percentage of a sample or a population to a conclusion about an individual member of that population or some part of that population.
      
  3. 類比論證 Arguments from Analogy

    事物在某些方面相似也應在另些方面相似。
    If two things are similar in some areas, they should also similar in other areas.

歸納推廣
Inductive Generalizations
統計論證
Statistical Arguments
類比論證
Argument from Analogy
基本原理
由樣本(Sample)中的某種特質推論出群體(Population)中某個百分比也具有該特質。

統計論證從前提中有關樣本或群體的百分比作出結論,而這個結論是有關群體中的一個獨立的成員或部分的成員。
事物在某些方面相似也應在另些方面相似。
X:主要項(Primary Subject
Y:類比項(Analogue),與主要項比較的事物
P:目標性質(Target Property),結論中提及的性質
a, b, c:相似點(Similarities),XY共有的性質

形式
1.       在被觀察過的Xs之中,有n%p
2.       所以,n%Xsp

1.       n%FG
2.       aF。   
3.       所以,aG
Where n > 0 and n < 100

1.       X has properties a, b, and c.
2.       Y has properties a, b, and c.
3.       Y has further property p. 
4.       X also has property p.
例子
1.       所有被觀察過的烏鴉都是黑色的。
2.       所以,所有烏鴉都是黑色的。
1.       95%的烏鴉是黑色的。
2.       a是一隻烏鴉。   
3.       所以,a是黑色的。
1.       水星、火星和土星具有圍繞太陽轉動、需要使用太陽的光源、受引力的影響這些性質。
2.       地球具有圍繞太陽轉動、需要使用太陽的光源、受引力的影響這些性質。
3.       地球有有機的生命存在。         
4.       所以,水星、火星和土星也有有機的生命存在。
1.       在被觀察過的烏鴉之中,有87%是黑色的。
2.       所以,87%的烏鴉是黑色的。
樣本:被觀察過的烏鴉
群體:所有烏鴉

成為強的
論證的條件
沒有以偏蓋全(Hasty Generalization)的謬誤
1.       取樣足夠(取樣不夠多);
2.       沒有結構偏差(取樣不夠廣);
3.       沒有已知失漏(沒有反例。有已知不利結論的資料被略去,比如隱瞞反例)。
w n = 100 à 對確論證
w n > 50 à 強。n越大,論證越強
w n = 50 à 不強,前提同等程度支持結論的否定
w n < 50 à 不強,前提較為支持結論的否定
w n = 0 à 不強,前提絕對支持結論的否定
1.       相干性(Relevance
若性質P á,導致性質Qá,則PQ正相干;
若性質P á,導致性質Qâ,則PQ負相干;
若性質P á,性質Q不變,則PQ不相干。
2.       強:相干相似點的數目 > 不相似點

2014年2月6日 星期四

女性割禮

二月六日是女性割禮國際零容忍日,這日的目的是表達反對女性割禮的訊息,並通過一系列的活動使人們了解到女性生殖器割除的危險性。

女性割禮是一項將女性的陰蒂或陰唇割除的儀式,主要流行於非洲大陸各部落間,部落認為將女性部份生殖器割除能避免她們出軌,保持貞操,同時亦能提高女子的生育能力。

割禮是自古流傳的習俗,女孩多在五、六歲開始就要割除陰蒂或陰唇,過程中沒有任何麻醉,再者,非洲貧窮問題非常嚴重,很多家庭都沒有能力聘請醫生或購買手術刀,女孩的母親會用家中的菜刀施割,更貧窮的家庭只能敲碎玻璃樽,用玻璃碎片割除器官,然後用植物的刺狀物將傷口縫合起來。過程中,大部份女孩都會經歷多次的昏厥,有些為了脫離痛苦更會嘗試咬 舌自盡,有些則因失血過多或細菌感染而慢慢地死去。

在我眼中,女性割禮是一項野蠻的文化活動,它有機會導致白頭人送黑頭人,而且它使孩童被最親和最信任的人傷害。當女孩的身體和心智仍未發展成熟時,她們便要飽受身體和心理上的巨大痛楚,而且行動的出發點亦是建基於父權體制之上,女性根本沒有抉擇權,這對女性毫不公平、毫不尊重。

最後,我希望活在香港的每一個人,能在今日為這群受害者送上祝福。

2014年2月1日 星期六

香港花卉展覽 2014



香港花卉展覽是康樂及文化事務署推廣園藝和綠化意識的重點項目。每年為數十萬本港市民和世界各地的園藝愛好者提供一個賞花和交流種花經驗的良機。二零一四年香港花卉展覽將於二零一四年三月七日至十六日在香港銅鑼灣維多利亞公園舉行。市民除了可以欣賞到花型秀麗、顏色奪目的主題花「家樂花」及各地的花卉之外,更可以觀賞到來自本地、內地及海外園藝機構展出悉心栽培的盆栽、造型優美的花藝擺設,以及色彩繽紛的園景設計。會場更設有售賣花卉及其他園藝產品的銷售攤位。

展覽期間,大會將會為入場人士舉辦一連串教育與娛樂並重的活動,計有學童繪畫比賽、攝影比賽、展品比賽、音樂及文娛表演、花藝示範、廚藝示範、植物護理工作坊、綠化推廣攤位、導賞服務、康體活動及親子遊戲等。

展覽地點香港維多利亞公園
展覽日期及時間2014年3月7日至16日﹝共10天﹞
上午9時至晚上9時
主題花家樂花
主題花滿園.樂滿家
入場費
全費14 元
小童、學生及60歲或以上的長者7 元
殘疾人士及其照管人
(每名殘疾人士只可與一名照管人同享優惠)
7 元
星期一至星期五期間之入場優惠
  • 60歲或以上的長者免費參觀
  • 殘疾人士及其照管人免費參觀
    (每名殘疾人士只可與一名照管人同享優惠)
  • 30人或以上團體參觀,成人半價優惠