Education

Probability for Financial Machine Learning

01 Feb 2020 09:00 - 07 Mar 2020 17:00
sofinspace, 3 Floors
BTS สยาม, สยามสแควร์ ซอย 1, ชั้น 3 หรือ รถยนต์ส่วนตัวสามารถนำรถมาจอดได้ที่ตึกศูนย์หนังสือจุฬา (ชั่วโมงละ 10 บาท)
กรุงเทพมหานคร, ประเทศไทย
0 followers

ความสำคัญของ Probability ต่องาน Finance


เป็นที่รู้กันดีว่าโอกาส ความเสี่ยง ความผันผวน หรือที่เรียกรวมกันว่าความไม่แน่นอนนั้น เป็นตัวละครสำคัญในโลกของการเงิน ทฤษฎีความน่าจะเป็นเป็นเครื่องมือที่ดีในการเข้าใจความไม่แน่นอนของมนุษยชาติในปัจจุบัน ดังเนื้อเมื่อเราพยายามจะกับความไม่แน่นอน กระบวนการที่สร้างขึ้นมานั้นก็ล้วนแต่มีฐานมาจากทฤษฎีความน่าจะเป็นทั้งสิ้น ไม่ว่าจะเป็นสถิติ Time Series Aanlysis กระบวนการ Stochastic หรือแม้แต่ Mechine Learning ก็ตาม


แม้ว่าในปัจจุบันเราจะมีเครื่องมือสำเร็จรูปมากมายให้ใช้งาน แต่เครื่องมือสำเร็จรูปก็คือเครื่องมือสำเร็จรูป หากเราต้องการดัดแปลง ปรับปรุง แก้ไข หรือพัฒนา เราจะไม่มีทางทำได้เลย หากเราไม่มีพื้นฐานความเข้าใจในทฤษฎีความน่าจะเป็นมากเพียงพอ

ยกตัวอย่างเช่น เราอาจสามารถสร้างแบบจำลองเพื่อทำนายราคาของสินค้าได้จากราคาของมันในอดีตย้อนหลังไปในช่วงเวลาหนึ่ง เช่นเราใช้ราคาของมันในวันที่ 1 2 และ 3 เพื่อทำนายราคาในวันที่ 4 และใช้ราคาของมันในวันที่ 2 3 และ 4 ในการทำนายราคาสินค้าในวันที่ 5 ซึ่งก็ฟังดูเป็นแนวคิดทีดี ปัญหาก็คือราคาของสินค้าชนิดนั้นในวันที่ 2 ก็จะไปส่งผลต่อการทำนายของทั้งวันที่ 4 และ 5 ซึ่งจะทำให้มันไม่อิสระต่อกัน

การไม่อิสระต่อกันนั้นทำให้เกิดปัญหาในการสร้างแบบจำลองด้วย Mechine Learning ซึ่งเราจำเป็นต้องแก้ไข และเราจะไม่มีทางแก้ไขมันได้เลยหากเราไม่เข้าใจความหมายของความเป็นอิสระซึ่งเป็นแนวคิดสำคัญอันหนึ่งในวิชาทฤษฎีความน่าจะเป็นดีมากพอ

สรุปแล้วความอิสระต่อกันคืออะไร ทำไมในกรณีนั้นมันถึงไม่อิสระ และถ้าอยากให้มันอิสระต่อกันต้องทำอย่างไร คอร์สนี้จะทำให้คุณตอบคำถามนั้นได้

ไม่ใช่แค่เรื่องความอิสระ แต่คำถามเกี่ยวกับการแจกแจงเดียวกัน ความเป็น Normal การมีความสัมพันธ์เชิงเส้น รวมถึงอีกมากมายก็จะถูกอธิบายอย่างลงลึกถึงรากในคอร์สนี้เช่นกัน

ยิ่งไปกว่านั้น ความเข้าใจเกี่ยวกับทฤษฎีความน่าจะเป็นขั้นพื้นฐานจะเป็นฐานความรู้สำหรับการไปอ่านเพื่อศึกษาต่อด้วยตัวเอง เมื่อไรก็ตามที่คุณสนใจจะศึกษาหัวข้ออื่น ๆ เพิ่มเติมนอกเหนือจากในคอร์ส ความเข้าใจพื้นฐานและทักษะการอ่านภาษาคณิตศาสตร์ที่เราฝึกกันในคอร์สนี้ จะทำให้คุณสามารถอ่านมันได้ง่ายขึ้น และสามารถเพิ่มเติมความรู้ให้ตัวเองได้อย่างไม่มีที่สิ้นสุด


คำถามที่จะตอบได้หลังเรียนคอร์สนี้จบ

เวลาเราต้องการประมาณค่าบางอย่าง เราอาจจะหยิบข้อมูลขึ้นมาบางส่วน คำนวนค่า แล้วก็อนุมานไปว่าค่าที่ได้นั้นคือค่าที่คำนวนมาได้จากทั้งหมด แน่นอนว่าหากเราหยิบข้อมูลมาน้อยเกินไป ค่าที่คำนวนได้ก็อาจจะเกิดความผิดพลาด แต่ถ้าหากเราหยิบข้อมูลมาจากเกินไป ก็จะเกิดต้นทุนตามมา ดังนั้นเราจึงควรเลือกหยิบข้อมูลมาจำนวนมากพอ แต่ไม่มากเกินไป คำถามก็คือมากพอแต่ไม่มากเกินไปที่ว่านั่นมันคือเท่าไร และเราสามารถหาค่านั้นออกมาได้อย่างไร

ในการประมาณค่าบางอย่าง เราสามารถเลือกตัวประมาณได้หลายแบบ คำถามก็คือ แต่ละตัวมีข้อดีข้อเสียอย่างไร แล้วเราจะรู้ได้อย่างไรว่าในสถานการณ์ไหนควรเลือกตัวประมาณค่าตัวไหน โดยเฉพาะอย่างยิ่งในโมเดลแปลก ๆ ที่เราอาจจะไม่รู้ด้วยซ้ำว่าควรเลือกตัวประมาณเป็นตัวไหน เราจะมีวิธีการหาตัวประมาณอย่างไรให้แน่ใจว่าได้ตัวประมาณค่าที่ดี

ใครที่เคยเรียน Machine Learning มาบ้างน่าจะคุ้นเคยกับการคำนวน Correlation ในเรื่อง Linear Regression เรารู้ว่าถ้า Correlation ของเราเข้าใกล้ 1 แปลว่าข้อมูลของเรามีความสัมพันธ์กันแบบ Linear ซึ่งคือดี คำถามก็คือ แค่ไหนเรียกว่าใกล้ บางคนอาจจะบอกว่ามากกว่า 0.8 ก็โอเคแล้ว ในขณะที่บางคนบอกแค่ 0.7 ก็พอ คำถามก็คือสรุปแล้วมันควรเป็นค่าเท่าไรกันแน่

ในหลาย ๆ กระบวนการใน Machine Learning นั้นต้องการเงื่อนไขว่าข้อมูลของเรานั้นต้องมีการแจกแจงแบบ Normal เราอาจทดสอบความเป็น Normal ของข้อมูลด้วยการทำมาวาดกราฟแล้วเทียบกับกราฟของ Normal แต่เราจะแน่ใจในสายตาเราได้จริงหรือเปล่า เราจะรู้ได้อย่างไรว่าเราไม่ได้คิดไปเองว่ามัน Normal แล้วเรามีวิธีการทดสอบที่ดีกว่านี้ได้อย่างไรบ้าง

ในการหาตัวประมาณของข้อมูล เราจะใช้ค่า Maximum likelihood คำถามคือจริง ๆ แล้วค่า Maximum likelihood นั้นหมายถึงอะไร และหากเรามีข้อมูลบางอย่างในใจเกี่ยวกับข้อมูลนั้น เราจะสามารถเติมข้อมูลพวกนั้นลงไปในสูตรการหาตัวประมาณ Maximum likelihood เพื่อทำให้มันแม่นยำขึ้นได้อย่างไร

เมื่อมีข้อมูลที่เราไม่ทราบรูปแบบการสุ่ม วิธีการง่ายที่สุดที่จะแสดงรูปแบบการกระจายของมันก็คือการวาด Histogram เราเชื่อว่าหากเราเพิ่มข้อมูลให้มากขึ้น Histogram ของเราก็จะมีค่าเหมือนกราฟการกระจายของจริงมากขึ้น คำถามก็คือ เรารู้ได้อย่างไรว่าสิ่งที่เราเชื่อนั้นถูก เรารู้ได้อย่างไรว่ามันลู่เข้าจริง ๆ และถ้าจริง มันลู่เข้าเร็วหรือช้าแค่ไหน





Agenda

Day

Content

Day1


Introduction

0 Basic Knowledge

  • Sets and set operations
  • Functions and graphing
  • Sequences and series
  • Counting technique

1 Probability

  • Sample spaces and events
  • Properties of probability
  • Conditional probability
  • Independence of event
  • Bayes' theorem

Day2


2 Random Variables

  • Discrete random variables
  • Expectation and variance of discrete random variables
  • The Bernoulli distribution
  • The Binomial distribution
  • The Geometric distribution
  • The Poisson distribution
  • Basic calculus
  • Continuous random variables
  • Expectation and variance of continuous random variables
  • Random number generation by rejection method
  • The Uniform distribution
  • Random number generation by inversion method
  • The Cauchy distribution
  • The Normal distribution
  • The Exponential distribution
  • The Poisson Process

Day3


2 Random Variables (cont.)

  • Basic multivariate calculus
  • Joint distributions
  • Marginal distributions
  • Covariance and correlation
  • Conditional distributions
  • Independence of random variables
  • The Multinormal distribution

3 Random Sampling

  • Functions of random variables
  • Moment generating function
  • Sampling distributions
  • Law of Large Number
  • Central Limit Theorem
  • The t distributions
  • Distributions of mean
  • The Chi-square distributions
  • Distributions of variance

Day4


4 Estimation

  • Point estimator
  • Unbiased estimator
  • Consistent estimator
  • Asymptotically Normal estimator
  • Moment method
  • Quantile and median
  • Maximum Likelihood method
  • Confident interval
  • Asymptotic confidence interval
  • Sample size
  • Variance reduction

Day5


5 Hypothesis Testing

  • Statistical hypotheses
  • Errors
  • The critical region, significant level and power of the test
  • Neyman-Pearson lemma
  • Likelihood ratio test
  • Test of parameters
  • Test of two sample parameters
  • p-value
  • Test of goodness of fit
  • Test of independence
  • Test of identically distributed

Day6


5 Hypothesis Testing (cont.)

  • Empirical distribution
  • Test of distribution choice
  • Test of normality
  • Regression


Instructor


อาจารย์ พรรษ วติวุฒิพงศ์ | อาจารย์ประจำภาควิชาคณิตศาสตร์ มหาวิทยาลัยมหิดล


การชำระเงิน


วิธีการสมัครเพียงแค่กดปุ่ม  Apply ที่ด้านล่างได้เลย

- ราคาคอร์ส 21,000 บาท แต่ถ้าสมัครเรียนก่อนวันที่ 14 ม.ค. 2020  จะได้รับส่วนลดราคา 3,000 บาท ทันที (เหลือ 18,000 บาท)

Venue

Date:  1 Feb - 7 Mar 2020 (6 days)
Time: 9:00 a.m. - 17:00 p.m.
Location: Sofinspace
(Google Maps: https://goo.gl/maps/o79V4sgswCKaEhNZA)
BTS สยาม, สยามสแควร์ ซอย 1, ชั้น 3
หรือ รถยนต์ส่วนตัวสามารถนำรถมาจอดได้ที่ตึกศูนย์หนังสือจุฬา (ชั่วโมงละ 10 บาท)

สอบถามรายละเอียดเพิ่มเติมทาง

  • Email: krin.c@madebyai.io
  • Call: 086-524-4463 (คริน)         

Application Form

Early Bird

สิทธิพิเศษสำหรับผู้ที่สมัครเรียนก่อนวันที่ 14 ม.ค. 2020
จะได้รับส่วนลดคอร์สเรียนราคา 3,000 บาท ทันที (เหลือ 18,000 บาท)

1836703e54af46417aaf114ad2c50f2a34ff4343
Organized by
TAUTOLOGY