Distribution Plots in Python

วิดีโอการสอนฟรีจาก Jose Portilla
Head of Data Science at Pierian Training
87 หลักสูตร
ผู้เรียน 4,356,745 คน
คำอธิบายการบรรยาย
Learn about Data Visualization with Seaborn and Python!
เรียนรู้เพิ่มเติมจากหลักสูตรเต็มรูปแบบ
Python for Data Science and Machine Learning Bootcamp
Learn how to use NumPy, Pandas, Seaborn , Matplotlib , Plotly , Scikit-Learn , Machine Learning, Tensorflow , and more!
วิดีโอออนดีมานด์ความยาว 24:46:40 • อัพเดทเมื่อ พฤษภาคม 2020
Use Python for Data Science and Machine Learning
Use Spark for Big Data Analysis
Implement Machine Learning Algorithms
Learn to use NumPy for Numerical Data
Learn to use Pandas for Data Analysis
Learn to use Matplotlib for Python Plotting
Learn to use Seaborn for statistical plots
Use Plotly for interactive dynamic visualizations
Use SciKit-Learn for Machine Learning Tasks
K-Means Clustering
Logistic Regression
Linear Regression
Random Forest and Decision Trees
Natural Language Processing and Spam Filters
Neural Networks
Support Vector Machines
ไทย [อัตโนมัติ]
สวัสดีทุกคนและยินดีต้อนรับสู่การบรรยายเรื่องการกระจายของซีบอร์นในการบรรยายครั้งนี้เราจะพูดถึงพล็อตประเภทต่างๆกับซีบอร์นที่ช่วยให้เราเห็นภาพการกระจายของชุดข้อมูล ไปข้างหน้าแล้วข้ามไปยังโน้ตบุ๊คจูปิเตอร์เพื่อเริ่มต้น ตกลงที่นี่ฉันอยู่ที่โน้ตบุ๊ค ฉันต้องการเริ่มต้นด้วยการนำเข้าทะเลและโดยการประชุมเรานำเข้าซีบอร์นเป็น asinus และเนื่องจากฉันอยู่ในสมุดบันทึกฉันจะเดินหน้าต่อไปและพูดว่าไลฟ์พล็อตของแมตต์พล็อตอย่างที่ฉันเห็นคือการสร้างภาพข้อมูลภายในสมุดบันทึก เอาล่ะ ทีนี้มารับข้อมูลกันบ้างพล็อตเรื่องพล็อตจริงมาพร้อมกับชุดข้อมูลบางตัวที่คุณสามารถโหลดได้โดยตรง และฉันจะคว้าหนึ่งเรียกว่าเคล็ดลับและบันทึกเป็นกรอบข้อมูลที่เรียกว่าเคล็ดลับ คุณสามารถทำได้โดยเพียงแค่บอกว่า Tipps เท่ากับชุดข้อมูลโหลด Asinus จากนั้นส่งเคล็ดลับเป็นสตริง และนี่จะโหลดชุดข้อมูลเคล็ดลับจากนั้นฉันสามารถตรวจสอบส่วนหัวของเฟรมได้และมันจะเป็นแบบนี้ มีเจ็ดคอลัมน์อยู่ตรงนี้และนี่เป็นเพียงข้อมูลอ้างอิงถึงคนที่ทานอาหารแล้วทิ้งเคล็ดลับหลังจากนั้น ดังนั้นคุณมีราคารวมหรือบิลอาหารเท่าไหร่เหลือเป็นเคล็ดลับเพศหรือเพศของคนออกจากปลายไม่ว่าพวกเขาเป็นนักสูบบุหรี่วันและเวลาที่พวกเขากินอาหารของพวกเขาหรือไม่ แล้วขนาดของปาร์ตี้ เอาล่ะ เรามาพูดถึงพล็อตเรื่องแรกของเราซึ่งก็คือพล็อต CISC ที่พล็อตนี้อนุญาตให้เราแสดงการกระจายของชุดการสังเกตแบบไม่แปรและคุณรู้ว่ามันเป็นวิธีที่แตกต่างกันในการพูดแค่ตัวแปรเดียว ลองเข้าไปสำรวจสิ่งนี้กัน ฉันจะบอกว่า Asinus คิดว่าพล็อตนี้แล้วสำหรับพล็อตนี้สิ่งที่คุณทำคือคุณเพิ่งผ่านไปในคอลัมน์เดียวของกรอบข้อมูลของคุณ ในกรณีนี้เราจะไปข้างหน้าและดูว่ามีการกระจายบิลทั้งหมด ดังนั้นฉันจะพูดทั้งหมดบิลแล้วเรียกใช้เซลล์และคุณควรได้พล็อตที่มีลักษณะเช่นนี้ หากคุณได้รับคำเตือนที่นี่ไม่ต้องกังวลกับมัน ที่จริงต้องทำถ้าแพคเกจอื่นที่เรียกว่าแบบจำลองสถิติ มันจะไม่ส่งผลกระทบต่อรหัส Seaborn ที่แท้จริงของคุณ แต่ที่นี่เราไม่มีคำเตือนใด ๆ ดังนั้นเราจึงตกลง สังเกตที่นี่ว่าฉันได้รับฮิสโตแกรมและสิ่งที่รู้จักกันในชื่อ k d e การประมาณความหนาแน่นของเคอร์เนลนั่นคือเส้นตรงนี้ ต่อมาในการบรรยายครั้งนี้เราจะพูดถึงว่า Katie นี้คืออะไรและเราจะสร้างมันขึ้นมาได้อย่างไร แต่สำหรับตอนนี้เราสามารถลบออกได้ถ้าเราต้องการโดยการพูดว่าเป็นข้อโต้แย้งเพิ่มเติมที่นี่ Katie เท่ากับเท็จ และเพียงแค่พิมพ์ Katy เท่ากับ false ทีนี้คุณก็แค่มีฮิสโตแกรมและฮิสโตแกรมก็เป็นเพียงแค่การกระจายตัวของการเรียกเก็บเงินทั้งหมดของคุณ คุณจะเห็นตรงนี้ว่าบนแกน y คุณมีจำนวนแล้วคุณมีแท่งเหล่านี้บนแกน X เป็นถังขยะ และนี่ก็หมายความว่าค่าใช้จ่ายทั้งหมดของคุณส่วนใหญ่อยู่ระหว่าง $ 10 ถึง $ 20 และถ้าคุณต้องการข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้คุณสามารถเปลี่ยนจำนวนของถังขยะเพื่อให้คุณสามารถไปข้างหน้าและมีอาร์กิวเมนต์ที่สามของ Sabin แล้วจำนวนที่เหมาะสมของการเสนอราคาและจำนวนขึ้นอยู่กับชุดข้อมูลของคุณ แต่ลองเข้าไปเลือก 30 ก่อน และตอนนี้เราสามารถได้คำจำกัดความที่ชัดเจนขึ้นและเรายังคงเห็นว่ามีค่าใช้จ่ายส่วนใหญ่เกิดขึ้นระหว่าง 10 ถึง 20 หากคุณเลือกค่าที่สูงเกินไปยกตัวอย่างไปข้างหน้าแล้วใส่ 100 คุณจะได้รับสถานการณ์แปลก ๆ ที่คุณจะเริ่มพล็อตอินสแตนซ์ทั้งหมดของค่ารวมทั้งหมดสำหรับจุดราคาทุกจุด โดยปกติแล้วฉันต้องการลองหาขนาดที่สมดุล แต่มันขึ้นอยู่กับพล็อตของคุณเอง ตกลง. ดูเหมือนว่าเรามีความคิดที่ดีเกี่ยวกับข้อมูลที่นี่ และถ้าเขาสามารถอ่านกราฟนี้โดยทั่วไปก็สามารถบอกได้ว่าตั๋วเงินส่วนใหญ่เกิดขึ้นระหว่าง 10 ถึง 20 ดอลลาร์และเริ่มจางหายไปเมื่อคุณสูงขึ้นเรื่อย ๆ ราคาบิลนั่นคือโครงเรื่องและช่วยให้คุณเห็นภาพการแจกแจงฮิสโตแกรมเป็นหลักและคุณสามารถเพิ่มเค้กเพื่อทานได้ แต่เราจะเรียนรู้เกี่ยวกับแผนการของ Katie ในภายหลัง ลองมาพูดถึงพล็อตของข้อต่อและข้อต่อจากทะเลฉันบอกได้ว่า Asinus ข้อต่อช่วยให้คุณจับคู่พล็อตนี้กับข้อมูลต่าง ๆ ซึ่งหมายความว่าคุณสามารถรวมการกระจายสองแบบเข้าด้วยกัน และโดยมากมันเป็นเพียงสองตัวแปร และเมื่อคุณมีพารามิเตอร์หลายอย่างที่เราจะเล่นด้วยซึ่งทำให้เราสามารถเลือกวิธีที่เราต้องการเปรียบเทียบการแจกแจงสองแบบนี้ ให้ฉันเข้าไปข้างในและแสดงให้คุณเห็นว่าเราสามารถใช้แก่นแท้เป็นจุดเริ่มต้นได้อย่างไร ก่อนอื่นคุณต้องมี passen ในตัวแปร x จากนั้นคุณต้องผ่านตัวแปร Y แล้วคุณต้องผ่านชุดข้อมูลของคุณ มาเริ่มจากส่วนแบ็คเอนด์กันดีกว่าดังนั้นข้อมูลผู้โดยสารจึงเป็นคำแนะนำ ดังนั้นการเรียงลำดับของ data frame แล้วสำหรับ x และ y คุณแค่ pasand สตริงที่เป็นชื่อคอลัมน์ สองสิ่งที่คุณต้องการเปรียบเทียบซึ่งกันและกัน ตัวอย่างเช่นบางทีฉันต้องการเปรียบเทียบการกระจายของบิลทั้งหมดเทียบกับขนาดปลาย ไปข้างหน้าและทำอย่างนั้น ฉันจะพูดทั้งหมดบิลเป็นอดีตของฉันและในทางของฉันการเข้าถึงฉันจะใส่ในคอลัมน์เคล็ดลับ ตอนนี้ฉันแค่ผ่านคอลัมน์เรียกเก็บเงินทั้งหมดที่คอลัมน์ปลายแล้วข้อมูลก็เท่ากับคำแนะนำและฉันได้พล็อตที่มีลักษณะเช่นนี้ซึ่งก็คือแผนการกระจายสองอย่าง คุณสามารถดูคำแนะนำบนแกน y และค่ารวมตามแกน x จากนั้นย่อเพื่อให้คุณสามารถเห็นพล็อตทั้งหมด จากนั้นในระหว่างที่ฉันมี scatterplot และ scatterplot จริง ๆ แล้วมีเหตุผลเพราะดูเหมือนว่ามันมีแนวโน้มว่าเมื่อคุณไปรวมบิลที่สูงขึ้นคุณจะได้ทิปที่สูงขึ้นและที่สมเหตุสมผล . ตอนนี้พล็อตร่วมจะให้พารามิเตอร์อาร์กิวเมนต์เพิ่มเติมที่เรียกว่าชนิดและพารามิเตอร์ชนิดนี้อนุญาตให้คุณส่งผลต่อสิ่งที่เกิดขึ้นจริงภายในพล็อตร่วมนี้ ตอนนี้โดยปกติแล้วมันจะกระจาย แต่คุณสามารถผ่านการโต้แย้งเช่น hex และ hex อนุญาตให้คุณทำการแทนการกระจายหกเหลี่ยม มันคล้ายกับสแกตเตอร์ยกเว้นโดยทั่วไปถ้าหกเหลี่ยมมีจำนวนของคะแนนในนั้นมันจะเข้มขึ้นและถ้ามันมีคะแนนน้อยกว่ามันก็จะจางลงเป็นหลักมันเป็นวิธีที่ไม่ต้องใส่คะแนนกระจายทั้งหมด รูปหกเหลี่ยมเหล่านี้ อีกข้อโต้แย้งหนึ่งที่เราสามารถระบุได้คือ e g ซึ่งหมายถึงการถดถอย และสิ่งนี้จะมีลักษณะคล้ายกับสแกตเตอร์ล็อตยกเว้นซีบรูนจะวาดเส้นการถดถอยลง ตอนนี้เรายังไม่ได้เรียนรู้เกี่ยวกับการถดถอยเชิงเส้นเท่าที่เป็นหัวข้อการเรียนรู้ของเครื่อง แต่ต่อมาเมื่อเราเข้าใกล้หัวข้อนั้นจะกลับมาที่นี่และพูดคุยถึงวิธีการสร้างบรรทัดนี้ แต่ที่จริงแล้วนี่แสดงให้เห็นว่าเกือบจะเป็นเส้นตรงพอดีกับข้อมูลจุดกระจายตัวและคุณสามารถเห็นได้ว่ามันมีค่า P ในค่าสัมประสิทธิ์ Peerson ซึ่งเราจะพูดถึงในภายหลังเมื่อเราพูดถึงการถดถอยเชิงเส้น ในที่สุดสิ่งอื่น ๆ ที่คุณสามารถใส่ได้ที่นี่คือ KDE และที่ช่วยให้คุณมีสิ่งนี้ได้เช่นกัน ฉันพูดถึง K-T ซึ่งแสดงให้เห็นถึงความหนาแน่นของจุดที่ตรงกับสิ่งเหล่านี้มากที่สุด เอาล่ะเรามาดูกันต่อไปและต่อจากพล็อตร่วมโดยปกติแล้วจะใช้พล็อตที่มีค่าสแกตเตอร์เริ่มต้นเพราะนั่นคืออันที่ง่ายที่สุดในการอ่านและให้ข้อมูลค่อนข้างน้อย เราจะไปข้างหน้าและขยายความคิดนั้นโดยการแสดงให้คุณเห็นพล็อตการจับคู่และพล็อตการจับคู่โดยพื้นฐานแล้วก็คือการพล็อตความสัมพันธ์แบบคู่ในกรอบข้อมูลทั้งหมด และยังสนับสนุนอาร์กิวเมนต์เฉดสีสำหรับคอลัมน์หมวดหมู่ซึ่งฉันจะแสดงให้คุณดูในภายหลัง แต่เราเห็นที่ด้านบนว่าเรามีพล็อตของข้อต่อนี้พล็อตที่จะทำคือการทำพล็อตร่วมนี้สำหรับการรวมกันที่เป็นไปได้ของคอลัมน์ตัวเลขในกรอบข้อมูลนี้ ให้ฉันไปแสดงให้คุณเห็นว่าฉันหมายถึงอะไร เพราะมันจะรวมกันทั้งหมด โดยทั่วไปคุณเพียงแค่เรียก S และ S คิดต่อการวางแผนและผ่านกรอบข้อมูลของคุณ และนี่คือสิ่งที่เรากำลังจะทำไม่น้อยตลอดหลักสูตร โปรดจำไว้ว่ายิ่งกรอบข้อมูลของคุณใหญ่ขึ้นเท่าไหร่ ดังนั้นหลายครั้งต่อการวางแผนใช้เวลาสักครู่ถ้าคุณมีกรอบข้อมูลขนาดใหญ่มากแทนที่จะเป็นเฟรมที่ค่อนข้างเล็ก ดังนั้นเราก็โอเค และที่นี่เรามีพล็อตคู่สำหรับค่าคอลัมน์ตัวเลขทั้งหมด ดังนั้นเราจึงมีขนาดเทียบกับ ขนาดบิลรวมกับเคล็ดลับ แล้วเมื่อคุณไปถึงพารามิเตอร์เทียบกับตัวเองสำหรับขนาดอินสแตนซ์กับขนาดแทนที่จะทำสแกตเตอร์แปลงจริงซึ่งเมื่อมันสมเหตุสมผลคุณก็แค่มีเส้นตรง คุณเห็นฮิสโตแกรมแทน และสิ่งเดียวกันสำหรับเคล็ดลับกับเคล็ดลับ และสำหรับการเรียกเก็บเงินทั้งหมดเทียบกับบิลทั้งหมดซึ่งหมายความว่าต่อการแปลงเป็นวิธีที่ดีมากในการแสดงข้อมูลของคุณอย่างรวดเร็ว และสิ่งที่สำคัญยิ่งกว่าคือคุณสามารถเพิ่มอาร์กิวเมนต์ฮิวกับสิ่งนี้ที่คุณกินและอาร์กิวเมนต์ฮิวจ์เป็นที่ที่คุณจะผ่านในคอลัมน์ จุดมุ่งหมายของคอลัมน์เด็ดขาดในหมวดหมู่หมายถึงไม่ได้เป็นหมวดหมู่ตัวเลขหรือต่อเนื่อง แต่จริง ตัวอย่างเช่นคอลัมน์เพศเป็นหมวดหมู่เนื่องจากมีสองหมวดหมู่ในนั้นมีชายและหญิง และเมื่อคุณผ่านสิ่งนี้ในขณะที่คุณส่งผ่านเพศชื่อที่เท่าเทียมกันในอาณานิคมและมันจะแต้มจุดข้อมูลตามคอลัมน์ที่คุณใส่ลงไป ดังนั้นที่นี่ทุกจุดสีเขียวเป็นเพศหญิงตามตำนานนี้และคะแนนชายทั้งหมด เรากำลังจะซูมออกเพื่อให้เราสามารถมองเห็นทุกสิ่ง จุดสีน้ำเงินทั้งหมดเป็นตัวผู้ และเป็นอาร์กิวเมนต์ที่สามคุณสามารถระบุจานสีและจานสีช่วยให้คุณสามารถสีนี้ด้วยจานสีที่เฉพาะเจาะจง เราจะพูดคุยเกี่ยวกับจานสีและสีและสไตล์ในตอนท้ายของซีรีย์การบรรยายทางทะเล ตอนนี้ฉันจะแสดงตัวอย่างให้คุณดู โดยพื้นฐานแล้วจะมีสตริงแผนที่สีเหล่านี้ซึ่งมาจากพล็อตนั้นแบบสดๆที่คุณสามารถผ่านในจานสีของเขาและพวกเขาจะเลือกสีบางอย่างสำหรับพารามิเตอร์ และที่นี่เราจะเห็นได้ว่าจดหมายเป็นสีน้ำเงินและผู้หญิงก็เป็นสีชมพูอ่อนแบบนี้ เอาล่ะ เราจะแตะบนจานสีและสไตล์เพิ่มเติม ไปข้างหน้าและไปที่รูจพล็อตและแผนการโกงจริง ๆ แล้วเป็นแนวคิดง่าย ๆ แต่เราจะใช้แนวคิดของพล็อตเรื่องโกงเพื่อสร้างจริง ฉัน. อธิบายพล็อต K-T ที่เราเห็นก่อนหน้านี้ว่าฉันกำลังจะไปข้างหน้าและพูดว่า A. รูจพล็อตและเหมือนกับแปลงพล็อตการกระจายที่คุณจะผ่านในคอลัมน์เดียวที่นี่ ดังนั้นเราจะพูดถึงเคล็ดลับแล้วลองผ่านคอลัมน์ค่ารวมทั้งหมดและสิ่งที่พล็อตเรื่องพรมทำคือแนวคิดง่ายๆ มันเพียงวาดเครื่องหมายเส้นประสำหรับทุกจุดในชุดการกระจายหรือชุดตัวแปรที่ไม่ซ้ำกันนี้โดยพื้นฐานแล้วเป็นตัวแปรเดียว ดังนั้นแทนที่จะเป็นฮิสโตแกรมให้ฉันไปข้างหน้าและทำให้พล็อตนี้อีกครั้งเพื่อเปรียบเทียบ ฉันจะพูดทันทีที่พล็อตเรื่องนี้เรียกเก็บเงินทั้งหมด เรียกใช้สิ่งนั้นและเราจะพูดว่าเคธี่เป็นเท็จ ตกลงดังนั้นความแตกต่างระหว่างฮิสโตแกรมที่นี่ด้านล่างและพล็อต Rugge นี้ก็คือฮิสโทแกรมนั้นมีถังขยะและนับว่ามีขีดกลางจำนวนเท่าใดในถังขยะนั้นจากนั้นก็แสดงให้เห็นว่าเป็นตัวเลขที่นี่ ไม่รู้ว่ามี 11 ถ้าเราจะดูที่นี้ สี่สิบห้าขีด พวกมันทั้งหมดซ้อนกันอยู่ด้านบนของกันและกัน แล้วตรงนี้เมื่อเราไปต่อในราคาบิลทั้งหมดจะมีรูจน้อยลงหรือมีขีดกลางน้อยกว่าและนั่นหมายความว่าเบ็นจะสูงขึ้น นั่นคือความสัมพันธ์พื้นฐานระหว่าง SR-GR RAM และพล็อตอันธพาลนี้ไปพล็อตเรื่องโกงแนวคิดที่ง่ายมาก คุณเพิ่งวาดเส้นประสำหรับทุกจุดตามเส้นการกระจาย เอาล่ะ นั่นคือบิลทั้งหมด สิ่งที่เราต้องการทำคือต่อยอดความคิดเรื่องแผนการโกงเพื่ออธิบายว่าพล็อต Kaytee ที่แท้จริงนี้คืออะไรและนั่นจะเป็นบรรทัดนี้ตรงนี้ เราจะสร้างบรรทัดนี้ได้อย่างไรจากแผนการโกงเหล่านี้ และคุณจะเห็นได้ว่ามันมีความสัมพันธ์กับพล็อตการโกงนับว่าพล็อตของ KDE หมายถึงพล็อตการประมาณค่าความหนาแน่นของเคอร์เนลและคุณสามารถ Google นี่ได้จริงๆ การประมาณค่าและนี่คือการเลื่อนลงจริงๆ นี่เป็นรูปที่ดีจริง ๆ ตรงนี้และส่วนใหญ่เราจะพยายามสร้าง คุณจะสังเกตเห็นว่าขีดกลางสีดำเหล่านี้แต่ละอันเป็นพล็อตหัวไม้ ดังนั้นคะแนนที่แท้จริง แล้วคุณก็มีการแจกแจงแบบเกาส์เล็ก ๆ น้อย ๆ เหล่านี้อยู่ด้านบนของแต่ละจุด แล้วคุณรวมพวกเขาทั้งหมด คุณจะได้การประมาณค่าความหนาแน่นเคอร์เนลสุดท้ายของ Currence นี้ ตอนนี้ฉันหมายถึงอะไรจากการแจกแจงแบบปกติหรือการแจกแจงแบบเกาส์ ถ้าคุณดูที่ Wikipedia Nessus ในทฤษฎีความน่าจะเป็นการกระจายตัวแบบปกติและผมบอกได้ว่าการกระจายความน่าจะเป็นแบบต่อเนื่องที่พบบ่อยที่สุดคือศูนย์กลาง นี่คือการแจกแจงแบบปกติที่คุณบอกว่าโอ้ทุกคนทำได้อย่างไรในการทดสอบและคุณให้คะแนนนักเรียนทุกคนแล้วดูการกระจายของคะแนน ดังนั้นปกติบางสิ่งที่ทำให้เป็นปกติเช่นนี้หรืออายุของผู้คนหรือความสูงของผู้คนมักมีหลายสิ่งหลายอย่างที่มักจะติดตามการกระจายตัว ตกลง. ไปข้างหน้าแล้วย้อนกลับไปยังสมุดบันทึกของดาวพฤหัสบดีและแตะที่หัวข้อเหล่านี้โดยละเอียดยิ่งขึ้นเพื่อทำสิ่งนี้ ฉันจะคัดลอกและวางรหัสจากสมุดบันทึกและคุณไม่จำเป็นต้องกังวลเกี่ยวกับการทำความเข้าใจรหัสนี้ มันเป็นเพียงการสร้างไดอะแกรมสำหรับคำอธิบายในการคัดลอกและวางสิ่งนี้ ฉันได้คัดลอกและวางรหัสนี้แล้วให้ฉันทำลายอย่างรวดเร็วจริง ๆ ด้วยรหัสนี้ทำ ฉันมีการนำเข้าเพียงไม่กี่อย่าง ฉันสร้างชุดข้อมูลของข้อมูลแบบสุ่ม จากนั้นฉันใช้เนื้อเรื่องพล็อตบนข้อมูลสุ่ม ฉันตั้งค่าแกน x สำหรับพล็อต ใช้ช่องว่างใด ๆ ของ Ohlund เพื่อสร้าง 100 จุดที่มีระยะห่างเท่ากันจาก X-Men X max แล้วที่นี่ นี่อาจเป็นส่วนที่ยากที่สุดที่จะเข้าใจเพราะใช้ห้องสมุด เรายังไม่ได้พูดถึง นั่นไม่ใช่เรื่องปกติ ทั้งหมดนี้คือพล็อตเป็นการกระจายแบบปกติสำหรับคะแนนพล็อตของแต่ละจุด และนั่นก็เป็นแบบนี้ เราไปข้างหน้าและซูมเข้าที่นี้ ที่นี่ฉันมีชุดข้อมูลของฉันและนี่คือชุดข้อมูลแบบสุ่ม ดังนั้นหากคุณเรียกใช้ปีนี้อาจดูแตกต่างไปเล็กน้อย แต่โปรดจำไว้ว่าเราไม่ได้มองหาเคล็ดลับอีกต่อไป เรากำลังทำงานกับข้อมูลสุ่มบางอย่าง สังเกตุฉันมีเส้นประสีฟ้าที่นี่แล้วเส้นสีเทาเหล่านี้แสดงการกระจายตัวแบบปกติ ด้านบนของเครื่องหมายขีดสีฟ้าแต่ละอัน นี่คือการกระจายตัวแบบปกติที่มีศูนย์กลางอยู่ที่เส้นประ และเรามีกลุ่มของพวกเขาอยู่ด้านบนของกันและกัน ทีนี้เราจะทำต่อไปและทำต่อไปคือบางส่วนของมันทั้งหมดเพื่อให้ได้ฟังก์ชั่นพื้นฐานความหนาแน่นของเคอร์เนล และนี่คือผลรวมของการแจกแจงปกติเล็กน้อยทั้งหมด เอาล่ะ การคัดลอกและวางบล็อคโค้ดที่สองจากสมุดบันทึกช่วยให้เราสามารถสรุปฟังก์ชั่นพื้นฐานทั้งหมดเหล่านี้ซึ่งเป็นเพียงแค่การแจกแจงปกติเหล่านี้เมื่อเธอรวมพวกเขาทั้งหมด คุณได้สิ่งที่มีลักษณะเช่นนี้ซึ่งเป็นเพียง Teekay พล็อตจากก่อนและนั่นคือวิธีที่พล็อตถูกสร้างจากพล็อตดิสก์ พล็อตแรกที่เราดูที่ t สูงสุดต่ำกว่า T เอาล่ะ นั่นคือวิธีการสำคัญทั้งหมดที่คุณสามารถแสดงการแจกแจงข้อมูลที่เราได้เห็นมากขึ้น เราจะตรวจสอบพล็อตต์ประเภทต่าง ๆ ทั้งหมดที่คอมพิวเตอร์เครื่องนี้และประเภทพล็อต เราเลื่อนกลับขึ้น พวกเขาเป็นพล็อตนี้และอีกครั้งว่าพล็อตนี้คุณสามารถใช้กับสองวิธีมี Kaytee เท่ากับเท็จและเป็นหลักเพียงแค่ดูกราฟ และจากนั้นคุณจะเห็นการประมาณความหนาแน่นของเคอร์เนล Caity ซึ่งอธิบายได้ว่าจุดสิ้นสุดนั้นเป็นเพียงผลรวมของการแจกแจงปกติรอบพรม A-plot joint plot คล้ายกับความคิดนี้ผ่านในคอลัมน์สองคอลัมน์และคุณผ่าน พวกมันเป็นอาร์กิวเมนต์ x และ y หากอาร์กิวเมนต์ที่สามของคุณเท่ากับข้อมูลจากนั้นพล็อตถัดไปที่เราเรียนรู้คือพล็อตคู่และพล็อตนั้นเพิ่งสร้างจากพล็อตและโดยพื้นฐานแล้วคือพล็อตร่วมสำหรับทุกคอลัมน์เดี่ยวหรือคอลัมน์ตัวเลขในชุดข้อมูลของคุณ เพิ่งผ่านไปในชุดข้อมูลเองว่า data frame และคุณสามารถส่งผ่านเฉดสีและ palette ได้ถ้าคุณต้องการให้สีตามคอลัมน์ที่มีการจัดหมวดหมู่ถัดไปที่เราได้เรียนรู้คือโดยปกติแล้ว Roug plot จะไม่ใช้แผนการของ Roug และแนวคิดหลักของการใช้พล็อตการโกงคือการสร้างตรรกะของพล็อตการประมาณค่าความหนาแน่นของเคอร์เนลซึ่งทำผ่านรหัสนี้ที่นี่ คุณสามารถใช้เวลาและอ่านรหัสนี้ได้ แต่ฉันแค่อยากรู้จุดนั้นเมื่อคุณใช้พล็อตเรื่องโกงและคุณต้องการสร้างพล็อตการประมาณความหนาแน่นของเคอร์เนลสำหรับเรื่อง Katie ที่คุณสามารถทำได้ พล็อตโกงมีการแจกแจงแบบปกติทั้งหมดเหล่านี้ไปยังแต่ละจุดแล้วนำผลรวมของคะแนนทั้งหมดเหล่านั้น และนั่นคือพล็อตการประมาณความหนาแน่นของเคอร์เนล และเราได้เห็นวิธีที่เราสามารถทำได้โดยใช้พล็อตนี้และเป็นจุดที่รวดเร็วหากคุณกำลังใช้พล็อตนี้ที่นี่เรารู้ว่าเราสามารถกำจัดพล็อต K-T โดยบอกว่า Kaytee เท่ากับเท็จ หากคุณต้องการแค่พล็อต K-T และไม่ต้องการ Beenz จริงที่นี่คุณสามารถใช้ Pasan แทนพล็อตที่คุณสามารถทำ Asinus KDE และจากนั้นผ่านเคล็ดลับ ค่าใช้จ่ายทั้งหมดและสิ่งนี้จะสร้างพล็อต K-T นี้โดยไม่มีการแจกจ่ายบาร์ เอาล่ะ หวังว่าคุณจะรู้ว่า Seaborn นั้นมีพลังอย่างไม่น่าเชื่อและง่ายมากตามรหัสที่คุณต้องเขียน ทุกสิ่งที่เราทำเสร็จไปในบรรทัดเดียว หากคุณพยายามทำสิ่งนี้มันทำแผนที่พล็อต lib มันจะพาคุณไปหลายสาย แต่สิ่งที่ดีเกี่ยวกับเรื่องนี้คือมันทำงานออกจากสิ่งที่คุณรู้เกี่ยวกับพล็อตสด . พล็อตแผนที่จำนวนมากที่อาศัยความรู้นั้นจะสามารถถ่ายโอนได้เพื่อแก้ไขสิ่งเล็กน้อยในพล็อตนี้ ตกลงฉันหวังว่าคุณจะเริ่มเพลิดเพลินไปกับ Seaborn อีกครั้งอย่างที่ฉันพูดถึงก่อนหน้านี้ว่าเป็นหนึ่งในห้องสมุดที่ฉันโปรดปรานและฉันแทบรอไม่ไหวที่จะแสดงให้คุณเห็นพล็อตประเภทสอง ขอบคุณทุกคนและฉันจะเห็นคุณในการบรรยายครั้งต่อไป