Saturday 22 July 2017

การย้าย ค่าเฉลี่ย อัต โมเดล


ค่าเฉลี่ยเคลื่อนที่เฉลี่ย ARMA (p, q) โมเดลสำหรับการวิเคราะห์อนุกรมเวลา - ตอนที่ 2 ในส่วนที่ 1 เราพิจารณาแบบจำลองอัตถิภาวนิยมของคำสั่ง p หรือที่เรียกว่าแบบจำลอง AR (p) เราได้แนะนำให้เป็นส่วนขยายของแบบจำลองการเดินแบบสุ่มในความพยายามที่จะอธิบายความสัมพันธ์แบบอนุกรมเพิ่มเติมในชุดข้อมูลทางการเงิน ในท้ายที่สุดเราตระหนักว่ามันไม่ได้มีความยืดหยุ่นเพียงพอที่จะจับภาพความสัมพันธ์ระหว่างกันได้อย่างเต็มที่ในราคาปิดของ Amazon Inc. (AMZN) และ SampP500 US Equity Index เหตุผลหลักสำหรับเรื่องนี้ก็คือทั้งสองอย่างนี้มีคุณสมบัติเป็นเงื่อนไข ซึ่งหมายความว่าพวกเขาจะไม่หยุดนิ่งและมีช่วงเวลาของการแปรปรวนที่แตกต่างกันหรือการจัดกลุ่มความผันผวนซึ่งไม่ได้นำเข้าบัญชีโดยรูปแบบ AR (p) ในบทความในอนาคตเราจะสร้างแบบจำลองการเคลื่อนที่แบบรวมอัตโนมัติแบบอัตถดถอย (ARIMA) รวมทั้งโมเดล heteroskedastic ที่มีเงื่อนไขของครอบครัว ARCH และ GARCH แบบจำลองเหล่านี้จะทำให้เรามีความพยายามในการพยากรณ์ราคาทรัพย์สินเป็นครั้งแรก อย่างไรก็ตามในบทความนี้เราจะแนะนำ Moving Average ของ order q model เรียกว่า MA (q) นี่เป็นส่วนหนึ่งของรูปแบบ ARMA ทั่วไปมากขึ้นและเราจำเป็นต้องทำความเข้าใจก่อนที่จะดำเนินการต่อ ขอแนะนำให้คุณอ่านบทความก่อนหน้านี้ในคอลเลกชันการวิเคราะห์อนุกรมเวลาหากคุณยังไม่ได้ดำเนินการ พวกเขาทั้งหมดสามารถพบได้ที่นี่ Moving Average (MA) รูปแบบของใบสั่ง q โมเดล Moving Average มีลักษณะคล้ายกับรุ่น Autoregressive ยกเว้นว่าจะเป็นชุดค่าผสมของชุดค่าผสมของชุดค่าผสมในอดีตที่ผ่านมาซึ่งเป็นชุดค่าผสมเชิงเส้นของเงื่อนไขเสียงสีขาวที่ผ่านมา อย่างเห็นได้ชัดนั่นหมายความว่าแบบจำลอง MA เห็นว่ามีสัญญาณรบกวนแบบสุ่มดังกล่าวเกิดขึ้นที่ค่าปัจจุบันในแต่ละรูปแบบ ซึ่งตรงกันข้ามกับรูปแบบ AR (p) ซึ่งสัญญาณรบกวนทางสีขาวจะถูกมองโดยอ้อมเท่านั้น ผ่านการถดถอยไปยังข้อตกลงก่อนหน้านี้ของชุด แตกต่างที่สำคัญคือรูปแบบของ MA จะเห็นเฉพาะการช็อกสุดท้ายครั้งสุดท้ายสำหรับแบบจำลอง MA (Q) ใด ๆ โดยที่แบบจำลอง AR (p) จะใช้การตรวจสอบก่อนหน้าทั้งหมดแม้ว่าจะลดลงอย่างมาก คำจำกัดความทางคณิตศาสตร์, MA (q) เป็นรูปแบบการถดถอยเชิงเส้นและมีโครงสร้างคล้ายกับ AR (p): Moving Average Model ของใบสั่ง q แบบอนุกรมเวลา,, คือแบบจำลองค่าเฉลี่ยเคลื่อนที่ของลำดับ q MA (q), if: begin xt wt beta1 w ldots betaq w end สัญญาณรบกวนสีขาวคือ E (wt) 0 และ sigma2 แปรปรวน ถ้าเราพิจารณา Backward Shift Operator (ดูบทความก่อนหน้า) จากนั้นเราสามารถเขียนข้างต้นเป็นฟังก์ชัน phi ของ: start xt (1 beta1 beta2 2 ldots betaq q) wt wtjq () wt end เราจะใช้ประโยชน์จากฟังก์ชัน phi ในบทความต่อ ๆ ไป คุณสมบัติการสั่งซื้อที่สองเช่นเดียวกับ AR (p) ค่าเฉลี่ยของกระบวนการ MA (q) เป็นศูนย์ นี้เป็นเรื่องง่ายที่จะเห็นเป็นค่าเฉลี่ยเป็นเพียงผลรวมของวิธีการของคำขาวเสียงซึ่งทั้งหมดเป็นศูนย์ เริ่มต้น text ensemble mux E (xt) ผลรวม E (wi) 0 end begin text ensemble sigma2w (1 beta21 ldots beta2q) ข้อความท้าย ensemble rhok left 1 text enspace k 0 sum betai beta sumq beta2i text enspace k 1, ldots, q 0 text พื้นที่โฆษณา k gt q ขวาสุด ที่ beta0 1. ตอนนี้จะสร้างข้อมูลจำลองและใช้เพื่อสร้าง correlograms นี้จะทำให้สูตรข้างต้นสำหรับ rhok คอนกรีตมากขึ้น การจำลองและ Correlograms ให้เริ่มต้นด้วยกระบวนการ MA (1) ถ้าเราตั้งค่า beta1 0.6 ให้เราได้รูปแบบดังต่อไปนี้: เช่นเดียวกับแบบจำลอง AR (p) ในบทความก่อนหน้านี้เราสามารถใช้ R เพื่อจำลองชุดดังกล่าวและทำเป็น correlogram เนื่องจากเรามีการฝึกซ้อมในซีรีส์การวิเคราะห์อนุกรมเวลาชุดก่อนหน้าในการดำเนินการแปลงแล้วฉันจะเขียนโค้ด R ในแบบเต็มแทนการแยกออก: ผลลัพธ์คือดังนี้ดังที่เราได้กล่าวไว้ข้างต้นในสูตรสำหรับ rhok สำหรับ k gt q ความสัมพันธ์กันทั้งหมดควรเป็นศูนย์ ตั้งแต่ q 1 เราจะเห็น peak ที่สำคัญที่ k1 และมี peak ไม่สำคัญตามมา อย่างไรก็ตามเนื่องจากการสุ่มตัวอย่างการสุ่มตัวอย่างเราควรคาดหวังว่าจะได้เห็นยอดที่มีนัยสำคัญ 5 จุด (อย่างเล็กน้อย) ในแผนภาพการคลาดเคลื่อนตัวอย่าง นี่คือสิ่งที่ correlogram แสดงให้เราเห็นในกรณีนี้ เรามีจุดสูงสุดที่สำคัญที่ k1 และจากนั้นเป็นยอดที่ไม่สำคัญสำหรับ k gt 1 ยกเว้นที่ k4 ซึ่งเรามีจุดสูงสุดที่มีนัยสำคัญเล็กน้อย ในความเป็นจริงนี่เป็นวิธีที่มีประโยชน์ในการดูว่าแบบจำลอง MA (q) เหมาะสมหรือไม่ เมื่อดูที่ correlogram ของซีรีส์หนึ่ง ๆ เราจะเห็นว่ามีอยู่จริงจำนวนมากเท่าไร ถ้ามีความล่าช้าดังกล่าวเราสามารถถูกต้องตามกฎหมายพยายามที่จะพอดีกับรูปแบบ MA (q) กับชุดใดชุดหนึ่ง เนื่องจากเรามีหลักฐานจากข้อมูลแบบจำลองของกระบวนการ MA (1) ตอนนี้จะพยายามและพอดีกับรูปแบบ MA (1) กับข้อมูลจำลองของเรา แต่น่าเสียดายที่ไม่มีคำสั่ง ma เทียบเท่ากับคำสั่ง autoregressive model ar ใน R. แต่เราต้องใช้คำสั่ง arima ทั่วไปมากขึ้นและตั้งค่าส่วนประกอบ autoregressive และ integrated ให้เป็นศูนย์ เราทำเช่นนี้โดยการสร้างเวกเตอร์ 3 ตัวและตั้งค่าคอมโพเนนต์สองตัวแรก (พารามิเตอร์ที่รวมกันอัตโนมัติและแบบบูรณาการตามลำดับ) เป็นศูนย์: เราได้รับผลลัพธ์ที่เป็นประโยชน์จากคำสั่ง arima ประการแรกเราจะเห็นว่าพารามิเตอร์นี้มีค่าประมาณเท่ากับ 0.602 ซึ่งใกล้เคียงกับค่าที่แท้จริงของ beta1 0.6 ประการที่สองข้อผิดพลาดมาตรฐานได้รับการคำนวณแล้วสำหรับเราทำให้ง่ายต่อการคำนวณช่วงความเชื่อมั่น ประการที่สามเราได้รับค่าความแปรปรวนโดยประมาณ log-likelihood และ Akaike Information Criterion (จำเป็นสำหรับการเปรียบเทียบรูปแบบ) ข้อแตกต่างที่สำคัญระหว่าง arima และ ar คือ arima ประเมินระยะการสกัดกั้นเนื่องจากไม่ได้หักค่าเฉลี่ยของชุดข้อมูล ดังนั้นเราจึงต้องระมัดระวังในการดำเนินการคาดการณ์โดยใช้คำสั่ง arima ดีกลับมาที่จุดนี้ภายหลัง เมื่อตรวจสอบอย่างรวดเร็วจะคำนวณช่วงความเชื่อมั่นสำหรับหมวก: เราจะเห็นว่าช่วงความเชื่อมั่น 95 มีค่าพารามิเตอร์ที่แท้จริงของ beta1 0.6 ดังนั้นเราจึงสามารถตัดสินแบบจำลองที่เหมาะสมได้ สิ่งนี้จะเกิดขึ้นได้อย่างไรเนื่องจากเราได้ทำการจำลองข้อมูลไว้ในที่แรกสิ่งที่เปลี่ยนแปลงไปอย่างไรถ้าเราปรับเปลี่ยนเครื่องหมายของ beta1 เป็น -0.6 ให้ทำการวิเคราะห์เดียวกัน: ผลลัพธ์คือดังนี้เราจะเห็นได้ว่าที่ k1 เรามีนัยสำคัญ สูงสุดใน correlogram ยกเว้นว่ามันแสดงให้เห็นความสัมพันธ์เชิงลบตามคาดหวังจากแบบจำลอง MA (1) ที่มีค่าสัมประสิทธิ์เป็นลบแรก อีกครั้งที่ยอดทั้งหมดเกินกว่า k1 ไม่มีนัยสำคัญ ให้พอดีกับรูปแบบ MA (1) และประมาณค่าพารามิเตอร์: หมวก -0.730 ซึ่งเป็นค่าความเบาบางต่ำของ beta1 -0.6 ขั้นสุดท้ายให้คำนวณช่วงความเชื่อมั่น: เราจะเห็นว่าค่าพารามิเตอร์ที่แท้จริงของ beta1-0.6 มีอยู่ภายในช่วงความเชื่อมั่น 95 โดยให้หลักฐานว่ามีรูปแบบที่เหมาะสม ให้ใช้กระบวนการเดียวกันสำหรับกระบวนการ MA (3) เวลานี้เราควรคาดหวังว่ายอดที่มีนัยสำคัญที่ k และ peak ที่ไม่สำคัญสำหรับ k gt 3. เราจะใช้ค่าสัมประสิทธิ์ต่อไปนี้ beta1 0.6, beta2 0.4 และ beta3 0.2 ให้จำลองกระบวนการ MA (3) จากรุ่นนี้ Ive เพิ่มจำนวนของตัวอย่างที่สุ่มถึง 1000 ในการจำลองนี้ซึ่งทำให้ง่ายต่อการดูโครงสร้างความสัมพันธ์ที่แท้จริงซึ่งทำให้ต้นทุนของชุดต้นฉบับลดลงอย่างมาก: ผลลัพธ์ที่ได้จะเป็นดังนี้: ตามที่คาดไว้สามยอดแรกมีความสำคัญ . อย่างไรก็ตามเป็นที่สี่ แต่เราสามารถให้เหตุผลได้อย่างถูกต้องว่าอาจเป็นเพราะความอคติในการสุ่มตัวอย่างเนื่องจากเราคาดว่าจะเห็นยอดที่สูงกว่า 5 แห่งที่มีความหมายมากกว่า kq ให้พอดีกับโมเดล MA (3) กับข้อมูลเพื่อทดลองใช้และประมาณค่าพารามิเตอร์: ค่าประมาณหมวก 0.544, หมวก 0.345 และหมวก 0.298 ใกล้เคียงกับค่าที่แท้จริงของ beta.10.6, beta20.4 และ beta30.3 ตามลำดับ นอกจากนี้เรายังสามารถสร้างช่วงความเชื่อมั่นโดยใช้ข้อผิดพลาดมาตรฐานตามลำดับ: ในแต่ละกรณีช่วงความเชื่อมั่น 95 รายการจะมีค่าพารามิเตอร์ที่แท้จริงและเราสามารถสรุปได้ว่าเรามีแบบจำลอง MA (3) ที่ดีพอสมควร ข้อมูลทางการเงินในส่วนที่ 1 เราพิจารณา Amazon Inc. (AMZN) และ SampP500 US Equity Index เราได้ติดตั้งโมเดล AR (p) ให้กับทั้งคู่และพบว่าโมเดลนั้นไม่สามารถจับภาพความซับซ้อนของความสัมพันธ์แบบอนุกรมได้อย่างมีประสิทธิภาพโดยเฉพาะอย่างยิ่งในส่วนของ SampP500 ที่มีผลกระทบต่อหน่วยความจำแบบยาว ฉันไม่เคยวางแผนแผนภูมิอีกครั้งสำหรับราคาและความเชื่อมโยงกันแทนฉันจะอ้างถึงโพสต์ก่อนหน้านี้ Amazon Inc. (AMZN) ให้เริ่มด้วยการพยายามเลือกแบบจำลอง MA (q) ให้กับ AMZN กล่าวคือมี q in เช่นเดียวกับในส่วนที่ 1 ให้ใช้ quantmod เพื่อดาวน์โหลดราคารายวันสำหรับ AMZN จากนั้นจึงแปลงค่าเหล่านี้ให้เป็นกระแสข้อมูลการเข้าสู่ระบบของราคาปิด: ขณะนี้เรามีล็อกสตรีมส่งผลให้เราสามารถใช้คำสั่ง arima ให้พอดีกับ MA (1), MA (2) และ MA (3) และประมาณค่าพารามิเตอร์ของแต่ละตัว สำหรับแมสซาชูเซตส์ (1) เราได้: เราสามารถคำนวณส่วนที่เหลือของผลตอบแทนต่อวันและรูปแบบที่พอดีได้: สังเกตว่าเรามียอดที่มีนัยสำคัญไม่กี่จุดที่ l k2, k11, k16 และ k18 แสดงว่าแบบจำลอง MA (1) ไม่น่าจะเป็นแบบที่เหมาะสมสำหรับพฤติกรรมของผลตอบแทนของล็อก AMZN เนื่องจากไม่มีลักษณะเป็นสัญญาณเสียงรบกวนสีขาว ลองใช้แบบจำลอง MA (2): ทั้งสองค่าประมาณสำหรับค่าสัมประสิทธิ์เบต้าเป็นค่าลบ ให้พล็อตส่วนที่เหลืออีกครั้ง: เราจะเห็นว่ามีความเกี่ยวโยงกันเกือบเป็นศูนย์ในสองสามข้อแรก อย่างไรก็ตามเรามียอดที่มีนัยสำคัญที่มีนัยสำคัญ 5 แห่งที่ความล่าช้า k12, k16, k19, k25 และ k27 นี่เป็นนัยที่โมเดล MA (2) สามารถจับภาพความสัมพันธ์ระหว่างกันได้มาก แต่ไม่ใช่ทั้งหมดของผลหน่วยความจำระยะยาว วิธีการเกี่ยวกับแบบจำลอง MA (3) อีกครั้งหนึ่งเราสามารถคำนวณส่วนที่เหลือได้: พล็อตส่วนที่เหลือของ MA (3) ดูเกือบจะเหมือนกับโมเดล MA (2) ไม่น่าแปลกใจเช่นเดียวกับการเพิ่มพารามิเตอร์ใหม่ลงในแบบจำลองที่อธิบายถึงความคล้ายคลึงกันของความล่าช้าที่สั้นลง แต่ก็ไม่ค่อยมีผลต่อความล่าช้าในระยะยาว ทั้งหมดนี้เป็นหลักฐานจากข้อเท็จจริงที่ว่านางแบบ (q) ไม่น่าจะเป็นประโยชน์ในการอธิบายความสัมพันธ์แบบอนุกรมในการแยก อย่างน้อยสำหรับ AMZN SampP500 ถ้าคุณจำได้ว่าในตอนที่ 1 เราเห็นว่าคำสั่งซื้อครั้งแรกที่แตกต่างกันไปในแต่ละวันจะส่งผลให้โครงสร้างของ SampP500 มียอดที่สำคัญหลายแห่งในหลาย ๆ ด้านทั้งสั้นและยาว นี่แสดงให้เห็นถึงความแตกต่างของความยืดหยุ่น (heteroskedasticity) ที่มีเงื่อนไข (เช่นการจัดกลุ่มความผันผวน) และผลกระทบของหน่วยความจำระยะยาว ทำให้เราสรุปได้ว่าแบบจำลอง AR (p) ไม่เพียงพอที่จะจับภาพความสัมพันธ์ที่เกิดขึ้นทั้งหมดในปัจจุบันได้ เมื่อมองภาพข้างต้นโมเดล MA (q) ไม่เพียงพอที่จะจับภาพความสัมพันธ์แบบอนุกรมเพิ่มเติมในส่วนที่เหลือของแบบจำลองที่พอดีกับชุดค่าล๊อคอิน ตอนนี้เราจะพยายามปรับโมเดล MA (q) ให้เป็นแบบ SampP500 หนึ่งอาจถามว่าทำไมเรากำลังทำเช่นนี้คือถ้าเรารู้ว่ามันไม่น่าจะเป็นแบบที่ดี นี่เป็นคำถามที่ดี คำตอบคือเราต้องดูว่ามันไม่เหมาะเพราะนี่เป็นกระบวนการที่ดีที่สุดที่เราจะทำต่อไปเมื่อเราเจอโมเดลที่ซับซ้อนมากขึ้นซึ่งอาจตีความได้ยากขึ้น ให้เริ่มต้นด้วยการได้รับข้อมูลและแปลงเป็นชุดคำสั่งซื้อที่แตกต่างกันไปของการเปลี่ยนแปลงลอการิทึมของราคาปิดรายวันเช่นเดียวกับในบทความก่อนหน้านี้ตอนนี้เรากำลังพอดีกับรูปแบบ MA (1) MA (2) และ MA (3) ชุดดังที่เราได้ทำไว้ข้างต้นสำหรับ AMZN ให้เริ่มต้นด้วย MA (1): ให้พล็อตส่วนที่เหลือของรุ่นที่ติดตั้งนี้: จุดสูงสุดที่สำคัญแรกเกิดขึ้นที่ k2 แต่ยังมีอีกหลายจุดที่มา นี่ไม่ใช่ความชัดเจนของสัญญาณรบกวนสีขาวและเราต้องปฏิเสธโมเดล MA (1) ให้เป็นแบบอย่างที่ดีสำหรับ SampP500 (2) อีกครั้งให้ทำพล็อตส่วนที่เหลือของรูปแบบแมสซาชูเซต (2) ที่ติดตั้งนี้: ในขณะที่จุดสูงสุดที่ k2 หายไป (ตามที่คาดหวัง) เราจะยังเหลือยอดที่มีนัยสำคัญที่ ล่าช้าอีกต่อไปในส่วนที่เหลือ อีกครั้งเราพบรูปแบบ MA (2) ไม่เหมาะสม เราควรคาดหวังว่าสำหรับแบบจำลอง MA (3) จะเห็นความสัมพันธ์แบบอนุกรมที่น้อยกว่า k3 มากกว่า MA (2) แต่เราควรคาดหวังว่าจะไม่มีการลดความล่าช้าใด ๆ อีก สุดท้ายให้ทำพล็อตของที่เหลือของรูปแบบ MA (3) ติดตั้ง: นี่คือสิ่งที่เราเห็นใน correlogram ของที่เหลืออยู่ ดังนั้นรุ่น MA (3) เช่นเดียวกับรุ่นอื่น ๆ ข้างต้นไม่เหมาะสำหรับ SampP500 ขั้นตอนต่อไปเราได้ตรวจสอบโมเดลชุดเวลา 2 แบบที่สำคัญรายละเอียดคือแบบจำลอง Autogressive ของคำสั่ง p, AR (p) และ Moving Average ของลำดับ q, MA (q) ใดก็ตามเราเห็นว่าพวกเขากำลังทั้งสองมีความสามารถในการอธิบายบางส่วนของความสัมพันธ์ในส่วนที่เหลือของการสั่งซื้อครั้งแรก differenced ราคาเข้าสู่ระบบรายวันของหุ้นและดัชนี แต่ความผันผวนของการจัดกลุ่มและผลกระทบหน่วยความจำยาวยังคงมีอยู่ ถึงเวลาแล้วที่เราจะหันความสนใจไปที่การรวมกันของทั้งสองโมเดลคือค่าเฉลี่ย Moving Average ของลำดับ p, q, ARMA (p, q) เพื่อดูว่าจะปรับปรุงสถานการณ์ให้ดีขึ้นหรือไม่ อย่างไรก็ตามเราจะต้องรอจนกว่าบทความถัดไปสำหรับการสนทนาเต็มรูปแบบเพียงแค่เริ่มต้นกับการค้าเชิงปริมาณ RIMA ย่อมาจากแบบจำลองการเคลื่อนที่แบบบูรณาการแบบอัตโนมัติ (single vector) ARIMA เป็นเทคนิคการพยากรณ์ที่คาดการณ์มูลค่าในอนาคตของชุดข้อมูลโดยอิงกับความเฉื่อยของตัวเอง การประยุกต์ใช้หลักของมันอยู่ในพื้นที่ของการคาดการณ์ในระยะสั้นที่ต้องใช้จุดข้อมูลทางประวัติศาสตร์อย่างน้อย 40 จุด ใช้งานได้ดีที่สุดเมื่อข้อมูลของคุณมีรูปแบบที่มั่นคงหรือสอดคล้องกันตลอดเวลาโดยมีจำนวนข้อผิดพลาดน้อยที่สุด บางครั้งเรียกว่า Box-Jenkins (หลังจากผู้เขียนต้นฉบับ) ARIMA มักจะดีกว่าเทคนิคการทำให้เกิดการชี้แจงเมื่อข้อมูลมีความยาวและความสัมพันธ์ระหว่างการสังเกตในอดีตมีเสถียรภาพ หากข้อมูลสั้นหรือมีความผันผวนสูงวิธีการปรับความเรียบบางวิธีอาจทำงานได้ดีขึ้น หากคุณไม่มีจุดข้อมูลอย่างน้อย 38 จุดคุณควรพิจารณาวิธีการอื่นนอกเหนือจาก ARIMA ขั้นตอนแรกในการใช้วิธีการ ARIMA คือการตรวจสอบ stationarity Stationarity แสดงให้เห็นว่าซีรีย์ยังคงอยู่ในระดับที่คงที่ตลอดเวลา หากมีแนวโน้มเช่นเดียวกับในแอปพลิเคชันทางเศรษฐกิจหรือธุรกิจส่วนใหญ่ข้อมูลของคุณจะยังคงอยู่ไม่หยุดนิ่ง ข้อมูลควรแสดงความแปรปรวนของความผันผวนตลอดเวลา นี่ดูได้อย่างง่ายดายด้วยชุดที่มีฤดูกาลมากและเติบโตขึ้นในอัตราที่รวดเร็วขึ้น ในกรณีเช่นนี้การขึ้นและการดาวน์ในฤดูกาลจะทวีความรุนแรงมากขึ้นเมื่อเวลาผ่านไป หากไม่พบเงื่อนไขการหยุดนิ่งเหล่านี้จะไม่สามารถคำนวณการคำนวณจำนวนมากที่เกี่ยวข้องกับกระบวนการนี้ได้ หากพล็อตข้อมูลแบบกราฟิกแสดงถึงความไม่เสถียรภาพคุณควรแตกต่างจากชุดข้อมูล Differencing เป็นวิธีที่ยอดเยี่ยมในการเปลี่ยนชุดแบบไม่ต่อเนื่องให้เป็นแบบคงที่ โดยการลบคำสังเกตในช่วงเวลาปัจจุบันออกจากข้อสังเกตก่อนหน้านี้ หากการแปลงนี้ทำเพียงครั้งเดียวกับชุดคุณจะกล่าวว่าข้อมูลนี้มีความแตกต่างกันเป็นครั้งแรก ขั้นตอนนี้เป็นหลักช่วยลดแนวโน้มหากชุดของคุณมีอัตราการเติบโตที่ค่อนข้างคงที่ หากอัตราการเติบโตเพิ่มขึ้นคุณสามารถใช้ขั้นตอนเดียวกันและทำให้ข้อมูลแตกต่างกันได้อีก จากนั้นข้อมูลของคุณจะแตกต่างกันไป Autocorrelations เป็นค่าตัวเลขที่ระบุว่าชุดข้อมูลเกี่ยวข้องกับตัวเองอย่างไรเมื่อเวลาผ่านไป อย่างแม่นยำมากขึ้นจะวัดว่าค่าข้อมูลอย่างมากที่ช่วงระยะเวลาที่ระบุเป็นจำนวนเท่าใดมีความสัมพันธ์กันเมื่อเวลาผ่านไป จำนวนรอบระยะเวลาโดยปกติจะเรียกว่าความล่าช้า ตัวอย่างเช่นค่าความสัมพันธ์ระหว่างความคลาดเคลื่อน 1 วัดค่าที่แตกต่างกันของช่วงเวลา 1 ช่วงเวลาที่มีความสัมพันธ์กันในชุดข้อมูล ความสัมพันธ์กันที่ความล่าช้า 2 วัดว่าข้อมูลสองช่วงเวลามีความสัมพันธ์กันอย่างไรในซีรี่ส์ Autocorrelations อาจอยู่ในช่วงตั้งแต่ 1 ถึง -1 ค่าใกล้เคียงกับ 1 แสดงถึงความสัมพันธ์ทางบวกที่สูงในขณะที่ค่าใกล้เคียงกับ -1 แสดงถึงความสัมพันธ์เชิงลบสูง มาตรการเหล่านี้มักได้รับการประเมินผ่านทางกราฟฟิกที่เรียกว่า correlagrams correlagram แปลงค่าความสัมพันธ์แบบอัตโนมัติสำหรับชุดข้อมูลหนึ่ง ๆ ที่มีความล่าช้าต่างกัน นี่เรียกว่าฟังก์ชัน autocorrelation และมีความสำคัญมากในวิธีการ ARIMA วิธีการ ARIMA พยายามที่จะอธิบายการเคลื่อนไหวในชุดเวลาแบบคงที่ในฐานะที่เป็นหน้าที่ของสิ่งที่เรียกว่าพารามิเตอร์อัตถิภาวนิยมและค่าเฉลี่ยเคลื่อนที่ พารามิเตอร์เหล่านี้เรียกว่าพารามิเตอร์ AR (autoregessive) และพารามิเตอร์ MA (ค่าเฉลี่ยเคลื่อนที่) อาจมีการเขียนแบบ AR ที่มีเพียง 1 พารามิเตอร์เท่านั้น X (t) A (1) X (t-1) E (t) โดยที่ X (t) เวลาชุดภายใต้การตรวจสอบ A (1) พารามิเตอร์ autoregressive ของลำดับ 1 X (t-1) ชุดเวลาล้าหลัง 1 ระยะเวลา E (t) ความผิดพลาดของรูปแบบนี้ก็หมายความว่าค่าใดก็ตาม X (t) สามารถอธิบายได้จากฟังก์ชันของค่าก่อนหน้าที่ X (t-1) รวมทั้งข้อผิดพลาดแบบสุ่มบางส่วนที่ไม่สามารถอธิบายได้ E (t) ถ้าค่าประมาณของ A (1) เท่ากับ. 30 มูลค่าปัจจุบันของชุดจะสัมพันธ์กับ 30 ค่าก่อนหน้า 1 แน่นอนว่าซีรีย์นี้อาจเกี่ยวข้องกับมากกว่าหนึ่งค่าที่ผ่านมา ตัวอย่างเช่น X (t) A (1) X (t-1) A (2) X (t-2) E (t) นี่แสดงว่าค่าปัจจุบันของชุดคือการรวมกันของสองค่าก่อนหน้านี้ทันที, X (t-1) และ X (t-2) รวมทั้งข้อผิดพลาดแบบสุ่ม E (t) แบบจำลองของเราตอนนี้เป็นโมเดลอัตรกรรรณ์ของคำสั่ง 2. การเคลื่อนที่แบบเฉลี่ย: แบบที่สองของแบบจำลอง Box-Jenkins เรียกว่าโมเดลเฉลี่ยเคลื่อนที่ แม้ว่ารูปแบบเหล่านี้มีลักษณะคล้ายกับรุ่น AR แต่แนวคิดที่อยู่เบื้องหลังพวกเขามีความแตกต่างกันออกไป การย้ายค่าเฉลี่ยจะสัมพันธ์กับสิ่งที่เกิดขึ้นในช่วง t เฉพาะกับข้อผิดพลาดแบบสุ่มที่เกิดขึ้นในช่วงเวลาที่ผ่านมาเช่น E (t-1), E (t-2) เป็นต้นแทนที่จะเป็น X (t-1), X ( t-2), (Xt-3) ตามแนวทาง autoregressive แบบเฉลี่ยถ่วงน้ำหนักโดยเฉลี่ยที่มีระยะ MA สามารถเขียนได้ดังนี้ X (t) - B (1) E (t-1) E (t) คําวา B (1) เรียกวา MA ของคําสั่ง 1. เครื่องหมายลบที่ดานหนาของพารามิเตอรใชสําหรับการประชุมเทานั้น ออกโดยอัตโนมัติโดยโปรแกรมคอมพิวเตอร์ส่วนใหญ่ แบบจำลองข้างต้นกล่าวง่ายๆว่าค่าที่กำหนดของ X (t) มีความสัมพันธ์โดยตรงกับความผิดพลาดแบบสุ่มในช่วงก่อนหน้า, E (t-1) และความผิดพลาดปัจจุบัน E (t) เช่นเดียวกับในกรณีของโมเดลอัตถิภาวนิยมโมเดลเฉลี่ยเคลื่อนที่สามารถขยายไปยังโครงสร้างการสั่งซื้อที่สูงขึ้นซึ่งครอบคลุมชุดค่าผสมต่างๆและความยาวเฉลี่ยที่เคลื่อนที่ได้ วิธีการ ARIMA ยังช่วยให้สามารถสร้างโมเดลที่มีทั้งค่าเฉลี่ยอัตรวจและเคลื่อนไหวโดยรวมเข้าด้วยกัน โมเดลเหล่านี้มักถูกเรียกว่าแบบผสม แม้ว่าสิ่งนี้จะทำให้เครื่องมือคาดการณ์ที่ซับซ้อนมากขึ้น แต่โครงสร้างอาจจำลองชุดข้อมูลได้ดีขึ้นและสร้างการคาดการณ์ที่แม่นยำขึ้น โมเดล Pure หมายความว่าโครงสร้างประกอบด้วยเฉพาะ AR หรือพารามิเตอร์ MA - ไม่ใช่ทั้งสองอย่าง โมเดลที่พัฒนาโดยวิธีนี้มักเรียกว่า ARIMA เนื่องจากใช้การผสมผสานของอัตมโนทัศน์ (AR), การผสมผสาน (I) - หมายถึงกระบวนการย้อนกลับของ differencing เพื่อสร้างการคาดการณ์และการดำเนินงานโดยเฉลี่ย (MA) แบบ ARIMA มักถูกระบุว่าเป็น ARIMA (p, d, q) นี่แสดงลำดับของคอมโพเนนต์ autoregressive (p) จำนวน operator ที่ต่างกัน (d) และคำสั่งที่สูงที่สุดของค่าเฉลี่ยเคลื่อนที่ ยกตัวอย่างเช่น ARIMA (2,1,1) หมายความว่าคุณมีแบบจำลองอัตถดถอยอันดับที่สองที่มีส่วนประกอบของค่าเฉลี่ยเคลื่อนที่อันดับแรกที่มีการจัดลำดับชุดหนึ่งครั้งเพื่อกระตุ้นให้เกิดการหยุดนิ่ง การเลือกข้อมูลจำเพาะที่ถูกต้อง: ปัญหาหลักในคลาสสิก Box-Jenkins กำลังพยายามตัดสินใจว่าจะใช้ ARIA ข้อกำหนดใดบ้างเพื่อใช้ - i. e. จำนวนอาร์เรย์และพารามิเตอร์ MA ที่รวมไว้ นี่คือสิ่งที่มากของ Box-Jenkings 1976 ได้ทุ่มเทให้กับกระบวนการระบุตัวตน ขึ้นอยู่กับการประเมินผลแบบกราฟิกและตัวเลขของการเชื่อมโยงความสัมพันธ์ระหว่างตัวอย่างและฟังก์ชันการเชื่อมโยงบางส่วน (autocorrelation) ดีสำหรับรุ่นพื้นฐานของคุณงานไม่ยากเกินไป แต่ละฟังก์ชันมีความสัมพันธ์กันโดยอัตโนมัติซึ่งมีลักษณะบางอย่าง อย่างไรก็ตามเมื่อคุณขึ้นไปอย่างซับซ้อนรูปแบบจะไม่สามารถตรวจพบได้ง่าย เพื่อให้เรื่องยากขึ้นข้อมูลของคุณเป็นเพียงตัวอย่างของกระบวนการอ้างอิงเท่านั้น ซึ่งหมายความว่าข้อผิดพลาดในการสุ่มตัวอย่าง (ข้อผิดพลาดค่าผิดพลาดในการวัด ฯลฯ ) อาจบิดเบือนกระบวนการระบุตัวตนทางทฤษฎี นั่นคือเหตุผลที่การสร้างแบบจำลอง ARIMA แบบดั้งเดิมเป็นศิลปะมากกว่าวิทยาศาสตร์.2.1แบบจำลองการเคลื่อนที่เฉลี่ย (แบบจำลอง MA) แบบจำลองชุดเวลาที่รู้จักกันในชื่อรูปแบบ ARIMA อาจรวมถึงข้อกำหนดเชิงอัตรกรรมและข้อกำหนด ในสัปดาห์ที่ 1 เราได้เรียนรู้คำอัตโนมัติในรูปแบบชุดเวลาสำหรับตัวแปร x t เป็นค่า lag ของ x t ตัวอย่างเช่นคำจำกัดความที่ล่าช้า 1 คือ x t-1 (คูณด้วยสัมประสิทธิ์) บทเรียนนี้กำหนดคำศัพท์เฉลี่ยเคลื่อนที่ ค่าเฉลี่ยเคลื่อนที่ในรูปแบบของชุดเวลาเป็นข้อผิดพลาดที่ผ่านมา (คูณด้วยสัมประสิทธิ์) อนุญาต (wt overset N (0, sigma2w)) ซึ่งหมายความว่า w w เป็นเหมือนกันกระจายอย่างอิสระแต่ละอันมีการแจกแจงแบบปกติมีค่าเฉลี่ย 0 และค่าความแปรปรวนเดียวกัน รูปแบบการเคลื่อนที่โดยเฉลี่ยที่ 1 แสดงโดย MA (1) คือ (xt mu wt theta1w) รูปแบบการเคลื่อนที่โดยเฉลี่ยแบบที่ 2 แสดงโดย MA (2) คือ (xt mu wt theta1w theta2w) , แสดงโดย MA (q) คือ (xt หมู่น้ำหนักเบา theta1w theta2w จุด thetaqu) หมายเหตุ ตำราเรียนและโปรแกรมซอฟต์แวร์จำนวนมากกำหนดรูปแบบที่มีสัญญาณเชิงลบก่อนข้อกำหนด นี้ไม่ได้เปลี่ยนคุณสมบัติทางทฤษฎีทั่วไปของรูปแบบแม้ว่าจะไม่พลิกสัญญาณเกี่ยวกับพีชคณิตของค่าสัมประสิทธิ์ประมาณและเงื่อนไข (unsquared) ในสูตรสำหรับ ACFs และความแปรปรวน คุณจำเป็นต้องตรวจสอบซอฟต์แวร์ของคุณเพื่อตรวจสอบว่ามีการใช้เครื่องหมายเชิงลบหรือบวกในการเขียนแบบจำลองที่ถูกต้องหรือไม่ R ใช้เครื่องหมายบวกในโมเดลต้นแบบดังที่เราทำที่นี่ คุณสมบัติเชิงทฤษฎีของซีรี่ส์เวลากับแบบ MA (1) โปรดทราบว่าค่าที่ไม่ใช่ศูนย์เดียวใน ACF ทางทฤษฎีเป็นค่าความล่าช้า 1 autocorrelations อื่น ๆ ทั้งหมดเป็น 0 ดังนั้นตัวอย่าง ACF กับ autocorrelation อย่างมีนัยสำคัญเท่านั้นที่ล่าช้า 1 เป็นตัวบ่งชี้ของรูปแบบที่เป็นไปได้ MA (1) สำหรับนักเรียนที่สนใจการพิสูจน์คุณสมบัติเหล่านี้เป็นส่วนเสริมของเอกสารฉบับนี้ ตัวอย่างที่ 1 สมมติว่าแบบจำลอง MA (1) คือ x t 10 w t .7 w t-1 ที่ไหน (น้ำหนักเกิน N (0,1)) ดังนั้นค่าสัมประสิทธิ์ 1 0.7 ทฤษฎี ACF ได้รับโดยพล็อตของ ACF นี้ดังนี้ พล็อตที่แสดงให้เห็นคือทฤษฎี ACF สำหรับ MA (1) กับ 1 0.7 ในทางปฏิบัติตัวอย่างมักไม่ค่อยให้รูปแบบที่ชัดเจนเช่นนี้ ใช้ R เราจำลองค่า n 100 ตัวอย่างโดยใช้โมเดล x t 10 w t .7 w t-1 โดยที่ w t iid N (0,1) สำหรับการจำลองแบบนี้ข้อมูลพร็อพเพอร์ตี้ตามเวลาจะเป็นดังนี้ เราไม่สามารถบอกได้มากจากพล็อตนี้ ตัวอย่าง ACF สำหรับข้อมูลจำลองดังต่อไปนี้ เราจะเห็นการเพิ่มขึ้นของความล่าช้าที่ 1 ตามด้วยค่าที่ไม่ใช่นัยสำคัญสำหรับความล่าช้าในอดีต 1. โปรดทราบว่าตัวอย่าง ACF ไม่ตรงกับรูปแบบทางทฤษฎีของ MA ต้นแบบ (1) ซึ่งเป็นค่าความสัมพันธ์ระหว่างความล่าช้าทั้งหมดที่ผ่านมา 1 จะเป็น 0 ตัวอย่างที่แตกต่างกันจะมีตัวอย่าง ACF ที่แตกต่างกันเล็กน้อยที่แสดงด้านล่าง แต่อาจมีลักษณะกว้างเช่นเดียวกัน สมบัติทางทฤษฎีของแบบเวลากับแบบ MA (2) สำหรับแบบจำลอง MA (2) คุณสมบัติทางทฤษฎีมีดังต่อไปนี้: โปรดทราบว่าเฉพาะค่าที่ไม่ใช่ศูนย์ใน ACF ทางทฤษฎีเท่านั้นสำหรับการล่าช้า 1 และ 2 ค่าความสัมพันธ์กับความล่าช้าที่สูงขึ้นคือ 0 ดังนั้น ACF ตัวอย่างกับ autocorrelations อย่างมีนัยสำคัญที่ล่าช้า 1 และ 2 แต่ autocorrelations ที่ไม่สำคัญสำหรับความล่าช้าสูงแสดงให้เห็นถึงรูปแบบที่เป็นไปได้ MA (2) iid N (0,1) ค่าสัมประสิทธิ์คือ 1 0.5 และ 2 0.3 เนื่องจากนี่คือ MA (2) ทฤษฎี ACF จะมีค่าที่ไม่ใช่ศูนย์เฉพาะที่ล่าช้า 1 และ 2 ค่าของสอง autocorrelations ไม่ใช่ศูนย์เป็นพล็อต ACF ตามทฤษฎี เกือบตลอดเวลาเป็นกรณีตัวอย่างข้อมูลเคยชินทำงานค่อนข้างสมบูรณ์เพื่อเป็นทฤษฎี เราจำลองค่าตัวอย่าง 150 ตัวอย่างสำหรับรุ่น x t 10 w t .5 w t-1 .3 w t-2 โดยที่ w t iid N (0,1) พล็อตชุดข้อมูลตามลำดับ เช่นเดียวกับชุดข้อมูลอนุกรมเวลาสำหรับข้อมูลตัวอย่าง MA (1) คุณไม่สามารถบอกได้มากจากข้อมูล ตัวอย่าง ACF สำหรับข้อมูลจำลองดังต่อไปนี้ รูปแบบเป็นเรื่องปกติสำหรับสถานการณ์ที่โมเดล MA (2) อาจเป็นประโยชน์ มีสอง spikes ที่สำคัญอย่างมีนัยสำคัญที่ล่าช้า 1 และ 2 ตามด้วยค่าที่ไม่สำคัญสำหรับความล่าช้าอื่น ๆ โปรดทราบว่าเนื่องจากข้อผิดพลาดในการสุ่มตัวอย่างตัวอย่าง ACF ไม่ตรงกับรูปแบบทางทฤษฎีเลย ACF for General MA (q) Models คุณสมบัติของโมเดล MA (q) โดยทั่วไปคือมีความสัมพันธ์กับค่าที่ไม่ใช่ศูนย์สำหรับ q lags แรกและ autocorrelations 0 สำหรับ lags ทั้งหมด gtq ความไม่เป็นเอกลักษณ์ของการเชื่อมต่อระหว่างค่า 1 และ (rho1) ในรูปแบบ MA (1) ในรูปแบบ MA (1) สำหรับค่า 1 1 1 ซึ่งกันและกันให้ค่าเช่นเดียวกับตัวอย่างให้ใช้ 0.5 เป็นเวลา 1 จากนั้นใช้ 1 (0.5) 2 เป็นเวลา 1 คุณจะได้รับ (rho1) 0.4 ในทั้งสองกรณี เพื่อตอบสนองข้อ จำกัด ทางทฤษฎีที่เรียกว่า invertibility เรา จำกัด โมเดล MA (1) ให้มีค่าที่มีค่าสัมบูรณ์น้อยกว่า 1. ในตัวอย่างที่ให้ไว้เพียงแค่ 1 0.5 จะเป็นค่าพารามิเตอร์ที่ยอมให้ใช้ได้ในขณะที่ 1 10.5 2 จะไม่ ความผันแปรของรูปแบบ MA แบบจำลอง MA กล่าวได้ว่าเป็น invertible ถ้าเป็นพีชคณิตเทียบเท่ากับรูปแบบ AR อนันต์ converging โดยการบรรจบกันเราหมายถึงค่าสัมประสิทธิ์ของ AR ลดลงเป็น 0 เมื่อเราเคลื่อนที่ย้อนเวลากลับ Invertibility คือข้อจํากัดที่ตั้งโปรแกรมเป็นซอฟต์แวร์ชุดเวลาที่ใช้ในการประมาณสัมประสิทธิ์ของแบบจำลองที่มีเงื่อนไขของ MA ไม่ใช่สิ่งที่เราตรวจสอบในการวิเคราะห์ข้อมูล ข้อมูลเพิ่มเติมเกี่ยวกับข้อ จำกัด ของการไม่สามารถซ่อนได้ของแบบจำลอง MA (1) จะได้รับในภาคผนวก ทฤษฎีขั้นสูงหมายเหตุ สำหรับแบบจำลอง MA (q) ที่มี ACF ที่ระบุมีรูปแบบที่มีการเปลี่ยนแปลงได้เพียงแบบเดียว เงื่อนไขที่จำเป็นสำหรับ invertibility คือสัมประสิทธิ์มีค่าเช่นว่าสมการ 1- 1 y - - q y q 0 มีคำตอบสำหรับ y ที่อยู่นอกวงกลมหน่วย R รหัสสำหรับตัวอย่างในตัวอย่างที่ 1 เราได้วางแผนทฤษฎี ACF ของโมเดล x t 10 w t 7w t-1 จากนั้นจำลองค่า n 150 จากแบบจำลองนี้และวางแผนตัวอย่างซีพียูและตัวอย่าง ACF สำหรับข้อมูลจำลอง คำสั่ง R ที่ใช้ในการวางแผน ACF ทางทฤษฎีคือ acfma1ARMAacf (mac (0.7), lag. max10) 10 ACL ล่าช้าสำหรับ MA (1) กับ theta1 0.7 lags0: 10 สร้างตัวแปรล่าช้าที่มีตั้งแต่ 0 ถึง 10 (h0) เพิ่มแกนนอนลงในพล็อตคำสั่งแรกกำหนด ACF และจัดเก็บไว้ในอ็อบเจกต์ (ACF) และจะมีการจัดเก็บข้อมูลไว้ในออปเจ็กต์ (acfma1, xlimc (1,10), ylabr, typeh, ACF หลักสำหรับ MA (1) ด้วย theta1 0.7) ชื่อ acfma1 (เลือกชื่อของเรา) พล็อตคำสั่ง (คำสั่งที่ 3) แปลงล่าช้ากับค่า ACF สำหรับล่าช้า 1 ถึง 10 พารามิเตอร์ ylab ตั้งชื่อแกน y และพารามิเตอร์หลักจะทำให้ชื่อเรื่องเป็นพล็อต หากต้องการดูค่าตัวเลขของ ACF เพียงแค่ใช้คำสั่ง acfma1 การจำลองและแปลงทำตามคำสั่งต่อไปนี้ xcarima. sim (n150 รายการ (mac (0.7))) เลียนแบบ n 150 ค่าจาก MA (1) xxc10 เพิ่ม 10 เพื่อให้ค่าเฉลี่ย 10. ค่าเริ่มต้นของการจำลองจะหมายถึง 0. plot (x, typeb, mainSimulated MA (1) data) acf (x, xlimc (1,10), mainACF สำหรับข้อมูลตัวอย่างจำลอง) ในตัวอย่างที่ 2 เราวางแผนใช้ทฤษฎี ACF ของโมเดล xt 10 wt .5 w t-1 .3 w t-2 จากนั้นจำลองค่า n 150 จากแบบจำลองนี้และวางแผนตัวอย่างซีพียูและตัวอย่าง ACF สำหรับข้อมูลจำลอง คำสั่ง R ใช้คือ acfma2ARMAacf (mac (0.5,0.3), lag. max10) acfma2 lags0: 10 พล็อต (ล่าช้า acfma2, xlimc (1,10), ylabr, typeh, ACF หลักสำหรับ MA (2) กับ theta1 0.5, theta20.3) abline (h0) xcarima. sim (n150 รายการ (mac (0.5, 0.3))) xxc10 พล็อต (x, typeb, หลักจำลองแมสซาชูเซตส์ (2) ซีรี่ส์) acf (x, xlimc (1,10), mainACF สำหรับข้อมูลจำลอง MA (2)) ภาคผนวก: การพิสูจน์คุณสมบัติของ MA (1) สำหรับนักเรียนที่สนใจนี่เป็นหลักฐานสำหรับคุณสมบัติทางทฤษฎีของโมเดล MA (1) ความแปรปรวน: (text (xt) text (mu wt theta1 w) ข้อความ 0 (wt) text (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) เมื่อ h 1 นิพจน์ก่อนหน้านี้ 1 w 2. สำหรับ h 2 ใด ๆ นิพจน์ก่อนหน้า 0 เหตุผลก็คือตามนิยามของความเป็นอิสระของน้ำหนัก E (w k w j) 0 สำหรับ k j ใด ๆ นอกจากนี้เนื่องจาก w t มีค่าเฉลี่ยเป็น 0, E (w j w j) E (w j 2) w 2 สำหรับซีรี่ส์เวลาให้ใช้ผลลัพธ์นี้เพื่อให้ได้ ACF ที่ระบุไว้ด้านบน รูปแบบแมสซาชูเซตแบบพลิกกลับเป็นแบบที่สามารถเขียนเป็นแบบจำลอง AR ที่ไม่มีที่สิ้นสุดซึ่งจะมาบรรจบกันเพื่อให้ค่าสัมประสิทธิ์ AR แปรผันไปเป็น 0 เมื่อเราเคลื่อนตัวกลับตามเวลาอนันต์ แสดงให้เห็นถึงความสามารถในการพลิกกลับของ MA (1) ได้ดี จากนั้นเราจะแทนความสัมพันธ์ (2) สำหรับ w t-1 ในสมการ (1) (3) (zt wt theta1 (z-theta1w) wt theta1z - theta2w) ณ เวลา t-2 สมการ (2) กลายเป็นเราแทนความสัมพันธ์ (4) สำหรับ w t-2 ในสมการ (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) ถ้าเราจะดำเนินการต่อ อนันต์) เราจะได้รับแบบอนุกรม AR อนันต์ (zt wt theta1 z - theta21z theta31z - theta41z จุด) หมายเหตุ แต่ที่ 1 1 สัมประสิทธิ์คูณความล่าช้าของ z จะเพิ่มขึ้น (อนันต์) ในขนาดที่เราย้ายกลับมา เวลา. เพื่อป้องกันปัญหานี้เราต้องใช้ 1 lt1 นี่เป็นเงื่อนไขสำหรับรูปแบบ MA (1) ที่มองไม่เห็น รูปแบบการสั่งซื้อ Infinite Order ในสัปดาห์ที่ 3 ให้ดูว่าแบบจำลอง AR (1) สามารถแปลงเป็นแบบจำลอง MA อนันต์: (xt - mu wt phi1w phi21w dots phik1 w counts sum phij1w) ข้อสรุปของคำพูดเสียงสีขาวที่ผ่านมาเป็นที่รู้จักกัน เป็นตัวแทนเชิงสาเหตุของ AR (1) กล่าวอีกนัยหนึ่ง x t เป็น MA ชนิดพิเศษที่มีจำนวนอนันต์ที่จะย้อนกลับไปในเวลา นี่เรียกว่าลำดับ MA หรือ MA () ที่ไม่มีขีด จำกัด คำสั่งที่แน่นอนคือแมสซาชูเซตส์อนันต์ลำดับ AR และคำสั่งใด ๆ ที่ จำกัด AR เป็นลำดับที่ไม่มีขีด จำกัด MA จำได้ว่าในสัปดาห์ที่ 1 เราสังเกตเห็นว่าข้อกำหนดสำหรับ AR (1) ที่หยุดนิ่งคือ 1 lt1 ให้คำนวณ Var (x t) โดยใช้การแทนสาเหตุ ขั้นตอนสุดท้ายนี้ใช้ข้อเท็จจริงพื้นฐานเกี่ยวกับชุดข้อมูลทางเรขาคณิตที่ต้องใช้ (phi1lt1) มิฉะนั้นชุดข้อมูลจะแตกต่างออกไป การนำทาง 8.4 การย้ายโมเดลเฉลี่ยแทนที่จะใช้ค่าที่ผ่านมาของตัวแปรพยากรณ์ในการถดถอยแบบจำลองค่าเฉลี่ยเคลื่อนที่จะใช้ข้อผิดพลาดในการคาดการณ์ที่ผ่านมาในรูปแบบการถดถอยเหมือนกัน y c et theta e theta e จุด theta e ที่ et มีเสียงสีขาว เราอ้างถึงนี้เป็นรูปแบบ MA (q) แน่นอนว่าเราไม่ได้สังเกตค่าของเอตดังนั้นจึงไม่ใช่การถดถอยตามความหมายปกติ สังเกตว่าแต่ละค่าของ yt สามารถคิดได้ว่าเป็นค่าเฉลี่ยถ่วงน้ำหนักของข้อผิดพลาดในการคาดการณ์ที่ผ่านมา อย่างไรก็ตามแบบจำลองค่าเฉลี่ยเคลื่อนที่ไม่ควรสับสนกับการปรับค่าเฉลี่ยการเคลื่อนที่โดยเฉลี่ยที่เรากล่าวถึงในบทที่ 6 โมเดลเฉลี่ยถ่วงน้ำหนักใช้สำหรับคาดการณ์ค่าในอนาคตขณะที่ใช้การปรับค่าเฉลี่ยโดยเฉลี่ยเพื่อใช้ประเมินแนวโน้มรอบของค่าในอดีต รูปที่ 8.6: ตัวอย่างสองตัวอย่างของข้อมูลจากโมเดลเฉลี่ยเคลื่อนที่ที่มีพารามิเตอร์ต่างกัน ซ้าย: MA (1) กับ y t 20e t 0.8e t-1 ขวา: MA (2) ด้วย y t e t - e t -1 0.8e t-2 ในทั้งสองกรณี e t จะกระจายสัญญาณรบกวนสีขาวเป็นปกติโดยมีค่าเฉลี่ยศูนย์และค่าความแปรปรวน 1 รูปที่ 8.6 แสดงข้อมูลบางส่วนจากแบบจำลอง MA (1) และ MA (2) การเปลี่ยนพารามิเตอร์ theta1, dots, thetaq ส่งผลให้รูปแบบชุดเวลาต่างกัน เช่นเดียวกับโมเดลอัตถดถอยความแปรปรวนของเทอมข้อผิดพลาด et จะเปลี่ยนขนาดของชุดไม่ใช่รูปแบบ สามารถเขียนแบบ AR (p) stationary เป็นแบบ MA (infty) ได้ ตัวอย่างเช่นการใช้การทดแทนซ้ำเราสามารถแสดงให้เห็นถึงรูปแบบ AR (1) นี้: เริ่มต้นใช้งาน yt amp phi1y และ amp phi1 (phi1y e) และ amp phi12y phi1 e และ amp phi13y phi12e phi1 e และ amptext end Provided -1 lt phi1 lt 1 ค่าของ phi1k จะเล็กลงเมื่อ k มีขนาดใหญ่ขึ้น ดังนั้นในที่สุดเราจึงได้รับ yt et phi1 e phi12 e phi13 e cdots กระบวนการ MA (infty) ผลย้อนกลับถือถ้าเรากำหนดข้อ จำกัด บางประการเกี่ยวกับพารามิเตอร์ MA จากนั้นแบบจำลอง MA เรียกว่า invertible นั่นคือเราสามารถเขียนกระบวนการ MA (q) invertible เป็นกระบวนการ AR (infty) ได้ โมเดลที่ไม่สามารถผันกลับไม่ได้ทำให้เราสามารถแปลงจากโมเดล MA ไปเป็น AR ได้ พวกเขายังมีคุณสมบัติทางคณิตศาสตร์บางอย่างที่ช่วยให้สามารถใช้งานได้ง่ายขึ้น ข้อ จำกัด invertible มีความคล้ายคลึงกับข้อ จำกัด stationarity สำหรับแบบจำลอง MA (1): -1lttheta1lt1 สำหรับโมเดล MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1 - theta2 lt 1. เงื่อนไขที่ซับซ้อนมากขึ้นถือได้สำหรับ qge3 อีกครั้ง R จะดูแลข้อ จำกัด เหล่านี้เมื่อประมาณแบบจำลอง

No comments:

Post a Comment