จำนวนนักท่องเที่ยวในจังหวัดต่าง ๆ ของประเทศไทยปี 2561

อยากฝึกทำแผนที่ chloropleth เลยใช้ข้อมูลจากกระทรวงการท่องเที่ยวและกีฬา ซึ่งเป็นสถิตินักท่องเที่ยวจากไทยและต่างประเทศที่ไปเยือนจังหวัดต่าง ๆ ในปี 2561 แยกเป็นผู้เยี่ยมเยือนทั้งหมด ผู้เยี่ยมเยือนชาวไทย และผู้เยี่ยมเยือนชาวต่างชาติ สร้างเป็นแผนที่ได้ดังนี้ พื้นที่สีน้ำเงินเข้มสุดคือจำนวนผู้เยี่ยมเยือน 10 ล้านคนขึ้นไป ยิ่งสีอ่อนลงคือจำนวนผู้เยี่ยมเยือนน้อยลงไปตามลำดับ 5 อันดับแรกที่มีผู้เยี่ยมเยือนรวมทั้งชาวไทยและชาวต่างชาติสูงสุด จังหวัด ผู้เยี่ยมเยือน (คน) กรุงเทพมหานคร 64,605,920 ชลบุรี 18,354,227 ภูเก็ต 14,383,348 เชียงใหม่ 10,844,753 นครราชสีมา 9,989,578 5 อันดับแรกที่มีผู้เยี่ยมเยือนชาวไทยสูงสุด จังหวัด ผู้เยี่ยมเยือน (คน) กรุงเทพมหานคร 40,348,164 นครราชสีมา 9,787,780 กาญจนบุรี 8,902,751 ชลบุรี 8,588,391 เพชรบุรี 8,515,431 5 อันดับแรกที่มีผู้เยี่ยมเยือนชาวต่างชาติสูงสุด จังหวัด ผู้เยี่ยมเยือน (คน) กรุงเทพมหานคร 24,257,756 ภูเก็ต 10,328,952 ชลบุรีContinue reading “จำนวนนักท่องเที่ยวในจังหวัดต่าง ๆ ของประเทศไทยปี 2561”

ปริมาณร้านสตาร์บัคส์ในแต่ละพื้นที่

พอได้เดินทางเข้าไปในเมืองแล้วมีความรู้สึกว่าเจอร้านสตาร์บัคส์เยอะจัง ในห้างเดียวกันบางทีมีถึง 3 สาขา ถ้าข้ามถนนไปก็จะเจออีก 2 สาขา เลยเกิดความสงสัยว่า พื้นที่ไหนนะที่มีร้านสตาร์บัคส์เยอะที่สุด ด้วยข้อจำกัดทางด้านเวลาและความยุ่งยากของการรวบรวมข้อมูล การสะกดชื่อเขตของเว็บสตาร์บัคส์สะกดชื่อเขตเดียวกันไม่เหมือนกัน เช่น เขตราชเทวีสะกดเป็น Rajthewi, Ratchathewi หรือ Ratchatevee ทำให้การแบ่งพื้นที่ตามชื่อเขตทำได้ยาก เลยเก็บสถิติเป็นตามรหัสไปรษณีย์แทน เท่ากับว่านับร้านโดยแบ่งเป็น 26 พื้นที่ตามรหัสไปรษณีย์ อันดับจำนวนร้านสตาร์บัคส์ในกรุงเทพมหานคร แบ่งตามรหัสไปรษณีย์ อันดับที่ เขต รหัสไปรษณีย์ จำนวนร้าน 1 คลองเตย วัฒนา 10110 34 2 ปทุมวัน 10330 29 3 ดินแดง พญาไท ราชเทวี 10400 18 4 วังทองหลาง ห้วยขวาง 10310 16 5 บางคอแหลม ยานนาวา สาทร 10120 15 6Continue reading “ปริมาณร้านสตาร์บัคส์ในแต่ละพื้นที่”

ตำแหน่งที่ผู้จัดการทีมฟุตบอลเคยเล่น มีผลต่อความสำเร็จในการคุมทีมไหม?

คำถามมาจาก Reddit จำไม่ได้แล้วว่ากระทู้ไหนจำรายละเอียดไม่ได้ แต่มีการถกเถียงกันว่าผู้เล่นตำแหน่งนี้ดีหนักหนา เป็นตำแหน่งที่ต้องมีความสามารถในการอ่านเกมทั้งทีมตัวเองและทีมตรงข้าม ทำให้สามารถพัฒนาเป็นผู้จัดการทีมที่ประสบความสำเร็จได้ ตามมาด้วยคำถามที่ว่าตำแหน่งที่ผู้จัดการทีมฟุตบอลเคยเล่นมาก่อนในอดีตมีผลต่อผลงานการคุมทีมจริงหรือไม่ เพื่อที่จะพิสูจน์คำถามนี้ในเชิงสถิติก็ต้องหาข้อมูลมาวัดกัน โดยรายชื่อผู้จัดการทีมมาจากผู้จัดการทีมที่เคยคุมทีมในพรีเมียร์ลีกอย่างน้อยหนึ่งทีม เหตุผลคือหาและรวบรวมข้อมูลง่าย  และคิดว่าข้อมูลน่าจะมากพอในการทำให้เห็นแนวโน้ม ผลการแข่งขันที่นำมาวิเคราะห์นั้นรวมทั้งหมดทุกทีมที่ผู้จัดการเหล่านั้นคุมไม่ว่าจะเป็นในหรือนอกพรีเมียร์ลีกก็ตาม อย่างแรกต้องนิยามคำว่าความสำเร็จในการคุมทีมก่อน ซึ่งเราใช้สถิติที่ชนะเป็นตัววัดความสำเร็จ ในที่นี้ดูอยู่สองอย่างคือ เปอร์เซ็นต์ชนะรวมทั้งหมดในทุกเกมทุกทีม คิดจากผลชนะจากทุกเกมที่เคยคุมมาหาเป็นเปอร์เซ็นต์ อย่างที่สองคือจุดพีคในอาชีพ คือเปอร์เซ็นต์ชนะที่สูงที่สุด* คิดจากเปอร์เซ็นต์ชนะแยกตามทีมที่เคยคุมมาก่อนแล้วหาเปอร์เซ็นต์ที่สูงที่สุด *ทั้งนี้เปอร์เซ็นต์ชนะที่สูงที่สุดจะตัดข้อมูลของทีมที่คุมน้อยกว่า38 นัด (เทียบเท่า 1 ฤดูกาล) หรือคุมน้อยกว่า 1 ปีออก เพื่อตัดข้อมูลของการคุมทีมชั่วคราวที่เปอร์เซ็นต์การแพ้ชนะแกว่ง (เช่นคุม 1 นัด ชนะ 1 นัดเท่ากับชนะ 100%) หรืออาจยังคุมทีมไม่ลงตัว การแบ่งตำแหน่งการเล่นแบ่งเป็นตำแหน่งหลัก ๆ คือกองหน้า กองกลาง กองหลัง และผู้รักษาประตู แต่ในข้อมูลจะมีบางคนที่เคยเล่นสองตำแหน่งหรือไม่พบข้อมูล (N/A) อยู่ด้วย จากข้อมูลผู้จัดการทีม 189 คน มีถึง 76 คน (40.2%) เคยเล่นตำแหน่งกองกลาง ตามมาด้วยContinue reading “ตำแหน่งที่ผู้จัดการทีมฟุตบอลเคยเล่น มีผลต่อความสำเร็จในการคุมทีมไหม?”

สถิติการประมูลป้ายทะเบียน

เมื่อเดือนที่ผ่านมาได้หัดใช้ภาษา R ที่เป็นภาษาที่ช่วยในการวิเคราะห์ทางสถิติ ทีนี้อยากจะฝึกการวิเคราะห์ เลยหาข้อมูลน่าสนใจที่มีปริมาณมากพอสมควร แต่ไม่มากจนเกินไปจนตรวจสอบความถูกต้องไม่ได้ และรูปแบบการจัดวางข้อมูลไม่ค่อยเป็นระเบียบ จะได้ฝึกทำข้อมูลดิบให้เป็นรูปแบบที่วิเคราะห์ง่ายขึ้นไปด้วย ย้อนไปเมื่อตอนต้นปีได้ช่วยที่บ้านการจองเลขทะเบียนผ่านกรมการขนส่งทางบก (คือจองเลขทะเบียนผ่านอินเตอร์เน็ตเฉยๆ ไม่ได้ประมูล) ตอนนั้นก็หาข้อมูลเกี่ยวกับเลขสวยพอสมควร และพบว่ากรมขนส่งฯ มีข้อมูลราคาประมูลย้อนหลังด้วย เลยนึกถึงว่าน่านำมาวิเคราะห์ดูเนอะ ซึ่งข้อมูลนี้มีย้อนหลังถึงปี 58 ในรูปแบบไฟล์ PDF และบางไฟล์มี 2 คอลัมน์บ้าง 3 บ้าง 5 บ้าง ไม่ค่อยเป็นแบบแผนเท่าไหร่ เหมาะกับการฝึกจัดระเบียบข้อมูลพอดี ในข้อมูลสถิติของกรมขนส่งฯ ได้แบ่งประเภทป้ายทะเบียนออกเป็น 3 กลุ่มคือ เลขพัน เลขเหมือน และเลขเรียงหรือเลขคู่ แต่ถ้าดูจากเว็บซื้อขายป้ายทะเบียนจะนิยมแบ่งเป็น 6 กลุ่มคือ เลขเหมือน เลขพัน เลขเรียง เลขคู่ (AABB) เลขสลับ (ABAB) และเลขหาบ (ABBA) ดังนั้นงานนี้จะขอแบ่งเป็น 6 กลุ่มตามความนิยมทั่วไป สิ่งที่อยากรู้มีอยู่สองอย่าง อยากรู้ว่าเลข 6 กลุ่มมีราคาการประมูลที่แตกต่างกันไหม ป้ายมีเลขContinue reading “สถิติการประมูลป้ายทะเบียน”

ถ้าฟุตบอลชนะกันที่การครองบอล?

ช่วงนี้บอลโลกกำลังมา แถมเวลาก็ช่างเป็นใจแก่การดูสดเหลือเกิน ซึ่งก็มักจะมีการหยิบยกสถิติขึ้นมาแสดงหรือกล่าวถึงเสมอ อย่างเช่น ทีมที่มีการครองบอลมากกว่า ยิงเข้ากรอบมากกว่า ต่อบอลมากกว่า ทั้งเพื่อทำนายผลก่อนแข่ง หรือวิเคราะห์รูปเกมตอนจบการแข่งขัน บางทีสถิติเหล่านั้นก็สอดคล้องกับผลการแข่งขัน แต่บางทีก็ไม่ ทีมที่ดูเป็นต่อมากกว่าบางครั้งกลับทำประตูไม่ได้เสียที หรือเผลอๆ อีกฝั่งที่ดูอ่อนกว่ากลับหาจังหวะโต้กลับทำประตูได้เสียอย่างงั้น จนมองว่าเป็นเรื่องที่น่าเสียดาย เกิดความสงสัยว่าถ้าฟุตบอลไม่ได้ดูกันที่ประตูล่ะ? ถ้าเกิดใช้ตัวชี้วัดอื่นในการบอกทีมแพ้ชนะจะเป็นยังไงนะ? ก็เลยเลือกใช้เปอร์เซ็นต์การครองบอลแล้วกัน เป็นตัวที่ไม่ได้เกี่ยวข้องโดยตรงกับการทำประตู และคนดู* รู้สึกว่าครองบอลได้มากกว่าคือเป็นฝ่ายคุมเกม เนื่องจากตอนนี้ (23/06/2018) ฟุตบอลโลกยังเล่นไม่จบรอบแบ่งกลุ่ม เลยนำข้อมูลของพรีเมียร์ลีก 2017/18 มาวิเคราะห์ ซึ่งเป็นลีกที่คนไทยคุ้นเคยและมีการเก็บสถิติเปอร์เซ็นต์การครองบอล (%Possession) [1] จากการแข่งขัน 380 นัด [2] โดยกำหนดให้** เปอร์เซ็นต์การครองบอลมากกว่าหรือเท่ากับ 60 คือชนะ ได้ 3 คะแนน เปอร์เซ็นต์การครองบอล อยู่ระหว่าง 60 – 40 คือเสมอ ได้ 1 คะแนน เปอร์เซ็นต์การครองบอลน้อยกว่าหรือเท่ากับ 40 คือแพ้ ไม่ได้คะแนน ถ้าคะแนนเท่ากันดูที่ผลต่างของประตูเหมือนเดิมContinue reading “ถ้าฟุตบอลชนะกันที่การครองบอล?”

[งานหยาบ] จำนวนร้านในสนามบินนานาชาติ

เรียกว่างานหยาบเพราะจริงๆ แล้วมันไม่สามารถนำไปสรุปอะไรจริงจังได้เลย งานนี้ทำขึ้นจากความแค้นใจล้วนๆ ที่ไปมาเก๊าแล้วสนามบินไม่ค่อยมีที่ให้ช็อปก่อนกลับเลย ร้านอาหารก็มีตัวเลือกไม่มาก ก็เลยอยากเปรียบเทียบร้านค้ากับร้านอาหารของสนามบินที่มีผู้โดยสารปริมาณมาก (อันดับ 1 ถึง 10) สนามบินมาเก๊าและสนามบินสุวรรณภูมิ จำนวนผู้โดยสารทั้งหมดของสนามบินต่างๆ ในปี 2017 Rank Airport Total passengers (2017) 1 Hartsfield-Jackson Atlanta International Airport 103,902,992 2 Beijing Capital International Airport 95,786,442 3 Dubai International Airport 88,242,099 4 Los Angeles International Airport 84,557,968 5 O’Hare International Airport 79,828,183 6 Heathrow Airport 78,014,598 7 Tokyo International (Haneda)Continue reading “[งานหยาบ] จำนวนร้านในสนามบินนานาชาติ”

Google Trends งานหนังสือ

ช่วงนี้เห็นคนใช้ Google trends ผ่านตาอยู่หลายคน อยากเล่นมั่ง เลยเอาเทรนด์ง่ายๆ มาดูดีกว่า ลองเอาข้อมูลการค้นหาคำว่า “งานหนังสือ” โดยใช้ข้อมูลจาก Google trends ตั้งแต่ปี 2013 มาเปรียบเทียบกับวันที่จัดงานหนังสือจริงๆ ดู ผลตามคาด ผลการค้นหาคำว่า “งานหนังสือ” สูงในช่วงเวลาเดียวกับช่วงที่จัดงานสัปดาห์หนังสือแห่งชาติ (ต้นปี) งานมหกรรมหนังสือระดับชาติ (ปลายปี) และงานเทศกาลหนังสือครอบครัวนักอ่าน (ที่น่าจะจัดครั้งสุดท้ายเมื่อวันที่ 17-23 กรกฎาคม 2013 ตามพีคสีเขียวหนึ่งเดียวนั่น)

สถิติเล็กๆ น้อยๆ ในยูธูป~

สักราวๆ ปีหรือสองปีที่แล้วเราเริ่มติดฟัง podcast รายการเล่าเรื่องผี (ที่จริงๆ แล้วเป็นรายการตลกปนรีวิวของกิน) ชื่อว่ายูธูป ในช่วงแรกๆ รายการยาวประมาณชั่วโมงกว่าๆ แล้วก็ขยับเป็นสองชั่วโมง สามชั่วโมง แล้วก็สี่ชั่วโมง! เลยเกิดความสงสัยว่าความยาวที่เพิ่มขึ้นมันมีผลต่อจำนวนผู้ฟังไหมนะ? ก่อนอื่นมาดูความยาวของยูธูปแต่ละตอนดีกว่า ข้อมูลเก็บเมื่อวันที่ 26 มกราคม 2561 ตั้งแต่ Ep.0 ถึง 83 เห็นชัดเลยว่าช่วงแรกๆ ความยาวตอนเริ่มแรกประมาณ 1-2 ชั่วโมง แล้วก็เริ่มอยู่ในช่วง 3-4 ชั่วโมง โดยถ้านับเฉพาะตอนปกติที่ไม่ใช่ตอนพิเศษ ตอนที่สั้นที่สุดคือ Ep.0:ผีอยู่รอบตัวเรา ที่ 1 ชั่วโมง 14 นาที 33 วินาที ถัดมาเป็น Ep.3:ผีที่มหาลัย ที่ 1 ชั่วโมง 19 นาที 27 วินาที และ Ep.6:ผีมือสอง เป็นตอนสุดท้ายที่จัดรายการความยาวต่ำกว่า 2 ชั่วโมง ส่วนตอนที่ยาวที่สุดคือ Ep.71:ผีนอกกระแส ตั้งContinue reading “สถิติเล็กๆ น้อยๆ ในยูธูป~”

สถิติเล็กๆ ของ The Mask Singer

The Mask Singer เป็นรายการที่ดูแล้วติดมาก ด้วยความอยากเผือกว่าภายใต้หน้ากากนั้นจะเป็นใครกัน แล้วก็แอบลุ้นแอบเชียร์แม้ว่าผู้เข้าแข่งขันจะไม่มีรางวัลอะไรตอบแทนที่ชนะเลยก็เถอะ บางครั้งก็เกิดความขัดใจว่าทำไมคนที่เราเชียร์ไม่เข้ารอบกัน จนเกิดข้อสังเกตว่าคนที่เข้ารอบส่วนใหญ่ร้องคนที่ 2 ทั้งนั้นเลยนี่นา แล้วมันจะเป็นอย่างนั้นจริงๆ ไหมนะ ก็เลยลองเก็บสถิติดู ผลปรากฏว่า… จากการเก็บข้อมูลเฉพาะการแข่งขันแบบประกบคู่ (ไม่นับรอบที่ร้องกัน 3,4 คนแล้วตกรอบคนเดียว) ในซีซันที่ 1 มีการแข่งขันทั้งหมด 31 คู่ หน้ากากที่ร้องเป็นคนที่ 2 ชนะ/เข้ารอบ 19 คน ซีซันที่ 2 มีการแข่งขันแบบประกบคู่ 29 คู่ หน้ากากที่ร้องเป็นคนที่ 2 ชนะ/เข้ารอบถึง 24 คน หน้ากากที่ร้องคนแรกชนะแค่ 5 คน ซีซันที่ 3 มีการแข่งขันแบบประกบคู่ 28 คู่ (จริงๆ จะมี 29 แต่เก็บข้อมูลก่อนวันที่ประกวดรอบสุดท้ายก็เลยยังไม่ครบ) หน้ากากที่ร้องเป็นคนที่ 2 ชนะ/เข้ารอบ 21 คน หน้ากากที่ร้องคนแรกชนะContinue reading “สถิติเล็กๆ ของ The Mask Singer”