Memperbaiki... Hama Pertumbuhan 

Di mana metode kuadrat terkecil digunakan? Perkiraan data eksperimen. Metode kuadrat terkecil Algoritma penyelesaian metode kuadrat terkecil

Metode kuadrat terkecil (OLS) memungkinkan Anda memperkirakan berbagai besaran menggunakan hasil banyak pengukuran yang mengandung kesalahan acak.

Karakteristik MNE

Ide utama dari metode ini adalah bahwa jumlah kesalahan kuadrat dianggap sebagai kriteria keakuratan penyelesaian masalah, yang ingin diminimalkan. Saat menggunakan metode ini, pendekatan numerik dan analitis dapat digunakan.

Secara khusus, sebagai implementasi numerik, metode kuadrat terkecil melibatkan pengambilan pengukuran sebanyak mungkin terhadap variabel acak yang tidak diketahui. Selain itu, semakin banyak perhitungan, semakin akurat solusinya. Berdasarkan kumpulan perhitungan ini (data awal), diperoleh kumpulan solusi estimasi lainnya, yang kemudian dipilih yang terbaik. Jika himpunan solusi diparameterisasi, maka metode kuadrat terkecil akan direduksi untuk mencari nilai parameter yang optimal.

Sebagai pendekatan analitis dalam penerapan LSM pada sekumpulan data awal (pengukuran) dan sekumpulan solusi yang diharapkan, ditentukan suatu hal tertentu (fungsional), yang dapat dinyatakan dengan rumus yang diperoleh sebagai hipotesis tertentu yang memerlukan konfirmasi. Dalam hal ini, metode kuadrat terkecil dilakukan untuk menemukan fungsi minimum pada himpunan kesalahan kuadrat dari data asli.

Harap dicatat bahwa ini bukan kesalahannya sendiri, tetapi kuadrat kesalahannya. Mengapa? Faktanya adalah sering kali penyimpangan pengukuran dari nilai eksak bersifat positif dan negatif. Saat menentukan rata-rata, penjumlahan sederhana dapat menghasilkan kesimpulan yang salah tentang kualitas estimasi, karena pembatalan nilai positif dan negatif akan mengurangi kekuatan pengambilan sampel beberapa pengukuran. Dan akibatnya, keakuratan penilaian.

Untuk mencegah hal ini terjadi, deviasi kuadrat dijumlahkan. Terlebih lagi, untuk menyamakan dimensi nilai terukur dan estimasi akhir, jumlah kesalahan kuadrat diekstraksi.

Beberapa aplikasi MNC

OLS banyak digunakan di berbagai bidang. Misalnya, dalam teori probabilitas dan statistik matematika, metode ini digunakan untuk menentukan karakteristik variabel acak seperti simpangan baku, yang menentukan lebar rentang nilai variabel acak.

Tugasnya adalah menemukan koefisien ketergantungan linier di mana fungsi dua variabel berada A Dan B mengambil nilai terkecil. Artinya, diberikan A Dan B jumlah simpangan kuadrat data eksperimen dari garis lurus yang ditemukan akan menjadi yang terkecil. Inilah inti dari metode kuadrat terkecil.

Jadi, penyelesaian contohnya adalah mencari titik ekstrem dari suatu fungsi dua variabel.

Menurunkan rumus untuk mencari koefisien. Sebuah sistem dua persamaan dengan dua hal yang tidak diketahui dikompilasi dan diselesaikan. Menemukan turunan parsial suatu fungsi oleh variabel A Dan B, kita menyamakan turunan ini dengan nol.

Kami menyelesaikan sistem persamaan yang dihasilkan menggunakan metode apa pun (misalnya, metode substitusi atau metode Cramer) dan memperoleh rumus untuk mencari koefisien menggunakan metode kuadrat terkecil (LSM).

Diberikan A Dan B fungsi mengambil nilai terkecil.

Itulah keseluruhan metode kuadrat terkecil. Rumus untuk mencari parameter A berisi jumlah , , , dan parameter N- jumlah data eksperimen. Kami menyarankan untuk menghitung nilai jumlah ini secara terpisah. Koefisien B ditemukan setelah perhitungan A.

Area utama penerapan polinomial tersebut adalah pengolahan data eksperimen (konstruksi rumus empiris). Faktanya adalah bahwa polinomial interpolasi yang dibangun dari nilai fungsi yang diperoleh melalui eksperimen akan sangat dipengaruhi oleh “kebisingan eksperimental”; terlebih lagi, ketika melakukan interpolasi, node interpolasi tidak dapat diulang, yaitu. Hasil percobaan yang berulang-ulang pada kondisi yang sama tidak dapat digunakan. Polinomial akar rata-rata kuadrat menghaluskan kebisingan dan memungkinkan Anda menggunakan hasil beberapa eksperimen.

Integrasi dan diferensiasi numerik. Contoh.

Integrasi numerik– perhitungan nilai integral tertentu (biasanya perkiraan). Integrasi numerik dipahami sebagai seperangkat metode numerik untuk mencari nilai integral tertentu.

Diferensiasi numerik– seperangkat metode untuk menghitung nilai turunan dari suatu fungsi yang ditentukan secara diskrit.

Integrasi

Rumusan masalah. Rumusan masalah matematis: perlu dicari nilai integral tertentu

dimana a, b berhingga, f(x) kontinu di [a, b].

Saat memecahkan masalah praktis, sering kali integral tidak nyaman atau tidak mungkin untuk diambil secara analitis: integral tersebut mungkin tidak dinyatakan dalam fungsi dasar, integral dapat diberikan dalam bentuk tabel, dll. Dalam kasus seperti itu, metode integrasi numerik adalah digunakan. Metode integrasi numerik menggunakan penggantian luas trapesium lengkung dengan jumlah terbatas luas bangun geometri sederhana yang dapat dihitung secara pasti. Dalam pengertian ini, mereka berbicara tentang penggunaan rumus kuadratur.

Kebanyakan metode menggunakan representasi integral sebagai jumlah terbatas (rumus kuadratur):

Rumus kuadratur didasarkan pada gagasan untuk mengganti grafik integran pada segmen integrasi dengan fungsi yang bentuknya lebih sederhana, yang dapat dengan mudah diintegrasikan secara analitis sehingga mudah dihitung. Tugas membuat rumus kuadratur paling mudah diterapkan untuk model matematika polinomial.

Tiga kelompok metode dapat dibedakan:

1. Metode dengan membagi segmen integrasi menjadi interval yang sama. Pembagian ke dalam interval dilakukan terlebih dahulu; biasanya interval dipilih sama (untuk memudahkan menghitung fungsi di ujung interval). Hitung luas dan jumlahkan (metode persegi panjang, trapesium, Simpson).

2. Metode pembagian segmen integrasi menggunakan titik-titik khusus (metode Gauss).

3. Perhitungan integral menggunakan bilangan acak (metode Monte Carlo).

Metode persegi panjang. Biarkan fungsi (gambar) perlu diintegrasikan secara numerik pada interval . Bagilah segmen tersebut menjadi N interval yang sama. Luas masing-masing N trapesium lengkung dapat diganti dengan luas persegi panjang.

Lebar semua persegi panjang adalah sama dan sama dengan:

Untuk memilih tinggi persegi panjang, Anda dapat memilih nilai fungsi di tepi kiri. Dalam hal ini, tinggi persegi panjang pertama adalah f(a), persegi kedua - f(x 1),..., N-f(N-1).

Jika kita mengambil nilai fungsi pada batas kanan untuk memilih tinggi persegi panjang, maka dalam hal ini tinggi persegi panjang pertama adalah f(x 1), yang kedua - f(x 2), ... , N - f(x N).

Seperti yang Anda lihat, dalam hal ini salah satu rumus memberikan perkiraan terhadap integral dengan kelebihan, dan rumus kedua dengan kekurangan. Ada cara lain - dengan menggunakan nilai fungsi di tengah segmen integrasi untuk perkiraan:

Estimasi kesalahan absolut metode persegi panjang (tengah)

Estimasi kesalahan absolut metode persegi panjang kiri dan kanan.

Contoh. Hitung seluruh interval dan bagi interval menjadi empat bagian

Larutan. Perhitungan analitik integral ini menghasilkan I=arctg(1)–arctg(0)=0.7853981634. Dalam kasus kami:

1)jam = 1; xo = 0; x1 = 1;

2) jam = 0,25 (1/4); x0 = 0; x1 = 0,25; x2 = 0,5; x3 = 0,75; x4 = 1;

Mari kita hitung menggunakan metode persegi panjang kiri:

Mari kita hitung menggunakan metode persegi panjang kanan:

Mari kita hitung menggunakan metode rata-rata persegi panjang:

Metode trapesium. Menggunakan polinomial derajat pertama (garis lurus yang ditarik melalui dua titik) untuk menginterpolasi hasil dalam rumus trapesium. Ujung-ujung segmen integrasi diambil sebagai titik interpolasi. Jadi, trapesium lengkung diganti dengan trapesium biasa, yang luasnya dapat dicari sebagai hasil kali setengah jumlah alas dan tinggi.

Dalam kasus integrasi N segmen untuk semua node, kecuali titik ekstrem segmen tersebut, nilai fungsi akan dimasukkan ke dalam jumlah total dua kali (karena trapesium yang berdekatan memiliki satu sisi yang sama)

Rumus trapesium dapat diperoleh dengan mengambil setengah jumlah rumus persegi panjang sepanjang tepi kanan dan kiri ruas:

Memeriksa stabilitas solusi. Biasanya, semakin pendek panjang setiap interval, mis. semakin besar jumlah interval ini, semakin kecil perbedaan antara nilai perkiraan dan nilai eksak integral. Hal ini berlaku untuk sebagian besar fungsi. Dalam metode trapesium, kesalahan dalam menghitung integral ϭ kira-kira sebanding dengan kuadrat langkah integrasi (ϭ ~ h 2). bagilah ruas tersebut menjadi interval N 0 dan tentukan jumlah luas trapesium tersebut. Maka Anda perlu menambah jumlah interval N 1, menghitung kembali jumlah trapesium dan membandingkan nilai yang dihasilkan dengan hasil sebelumnya. Ini harus diulangi sampai (N i) sampai keakuratan hasil yang ditentukan tercapai (kriteria konvergensi).

Untuk metode persegi panjang dan trapesium, biasanya pada setiap langkah iterasi jumlah interval bertambah 2 kali lipat (N i +1 = 2N i).

Kriteria konvergensi:

Keuntungan utama aturan trapesium adalah kesederhanaannya. Namun, jika presisi tinggi diperlukan saat menghitung integral, metode ini mungkin memerlukan terlalu banyak iterasi.

Kesalahan mutlak metode trapesium diperkirakan sebagai
.

Contoh. Hitung kira-kira integral tertentu menggunakan rumus trapesium.

a) Membagi segmen integrasi menjadi 3 bagian.
b) Membagi segmen integrasi menjadi 5 bagian.

Larutan:
a) Sesuai dengan ketentuan, segmen integrasi harus dibagi menjadi 3 bagian, yaitu.
Mari kita hitung panjang setiap segmen partisi: .

Jadi, rumus umum trapesium direduksi menjadi ukuran yang sesuai:

Akhirnya:

Izinkan saya mengingatkan Anda bahwa nilai yang diperoleh adalah nilai perkiraan luas.

b) Mari kita bagi segmen integrasi menjadi 5 bagian yang sama besar, yaitu. Dengan menambah jumlah segmen, kami meningkatkan keakuratan penghitungan.

Jika , maka rumus trapesium berbentuk sebagai berikut:

Mari kita cari langkah partisinya:
, yaitu panjang setiap ruas perantara adalah 0,6.

Saat menyelesaikan tugas, akan lebih mudah untuk memformalkan semua perhitungan menggunakan tabel perhitungan:

Di baris pertama kita menulis “counter”

Sebagai akibat:

Nah, memang ada klarifikasinya, dan serius!
Jika untuk 3 segmen partisi, maka untuk 5 segmen. Jika Anda mengambil segmen yang lebih besar => akan lebih akurat lagi.

rumus Simpson. Rumus trapesium memberikan hasil yang sangat bergantung pada besar langkah h, sehingga mempengaruhi keakuratan penghitungan integral tertentu, terutama jika fungsinya nonmonotonik. Dapat diasumsikan bahwa keakuratan perhitungan akan meningkat jika, alih-alih segmen lurus menggantikan fragmen lengkung dari grafik fungsi f(x), kita menggunakan, misalnya, fragmen parabola yang diberikan melalui tiga titik yang berdekatan pada grafik. Penafsiran geometri ini mendasari metode Simpson dalam menghitung integral tertentu. Seluruh interval integrasi a,b dibagi menjadi N segmen, panjang segmen juga akan sama dengan h=(b-a)/N.

Rumus Simpson terlihat seperti:

istilah sisa

Dengan bertambahnya panjang ruas, keakuratan rumus menurun, sehingga untuk meningkatkan akurasi digunakan rumus majemuk Simpson. Seluruh interval integrasi dibagi menjadi N segmen identik yang berjumlah genap, panjang segmen juga akan sama dengan h=(b-a)/N. Rumus senyawa Simpson adalah:

Dalam rumusnya, ekspresi dalam tanda kurung mewakili jumlah nilai integran di ujung segmen dalam ganjil dan genap.

Sisa rumus Simpson sebanding dengan pangkat empat langkah:

Contoh: Dengan menggunakan aturan Simpson, hitung integralnya. (Solusi yang tepat - 0,2)

metode Gauss

Rumus kuadratur Gaussian. Prinsip dasar rumus kuadratur tipe kedua terlihat dari Gambar 1.12: titik-titiknya perlu ditempatkan sedemikian rupa X 0 dan X 1 di dalam segmen [ A;B], sehingga luas total “segitiga” sama dengan luas “ruas”. Saat menggunakan rumus Gauss, segmen asli [ A;B] direduksi menjadi segmen [-1;1] dengan mengganti variabel X pada

0.5∙(BA)∙T+ 0.5∙(B + A).

Kemudian , Di mana .

Penggantian seperti itu dimungkinkan jika A Dan B terbatas, dan fungsinya F(X) terus menerus pada [ A;B]. Rumus Gauss di N poin x saya, Saya=0,1,..,N-1 di dalam segmen [ A;B]:

, (1.27)

Di mana itu saya Dan dan saya untuk berbagai N diberikan dalam buku referensi. Misalnya kapan N=2 A 0 =A 1 =1; pada N=3: T 0 =t 2"0,775, T 1 =0, A 0 =SEBUAH 2 "0,555, A 1 "0,889.

Rumus kuadratur Gaussian

diperoleh dengan fungsi bobot sama dengan kesatuan p(x)= 1 dan node x saya, yang merupakan akar dari polinomial Legendre

Kemungkinan dan saya mudah dihitung menggunakan rumus

Saya=0,1,2,...N.

Nilai node dan koefisien untuk n=2,3,4,5 diberikan dalam tabel

Memesan Node Kemungkinan
N=2 x 1=0 x 0 =-x 2=0.7745966692 Sebuah 1=8/9 SEBUAH 0 =SEBUAH 2=5/9
N=3 x 2 =-x 1=0.3399810436 x 3 =-x 0=0.8611363116 SEBUAH 1 =SEBUAH 2=0.6521451549 SEBUAH 0 =SEBUAH 3=0.6521451549
n=4 X 2 = 0 X 3 = -X 1 = 0.5384693101 X 4 =-X 0 =0.9061798459 A 0 =0.568888899 A 3 =A 1 =0.4786286705 A 0 =A 4 =0.2869268851
N=5 X 5 = -X 0 =0.9324695142 X 4 = -X 1 =0.6612093865 X 3 = -X 2 =0.2386191861 A 5 =SEBUAH 0 =0.1713244924 A 4 =SEBUAH 1 =0.3607615730 A 3 =SEBUAH 2 =0.4679139346

Contoh. Hitung nilainya menggunakan rumus Gauss untuk N=2:

Nilai tepatnya: .

Algoritma penghitungan integral menggunakan rumus Gauss tidak melibatkan penggandaan jumlah segmen mikro, tetapi penambahan jumlah ordinat sebesar 1 dan membandingkan nilai integral yang diperoleh. Kelebihan rumus Gauss adalah akurasinya yang tinggi dengan jumlah ordinat yang relatif sedikit. Kekurangan: tidak nyaman untuk perhitungan manual; penting untuk menyimpan nilai-nilai dalam memori komputer itu saya, dan saya untuk berbagai N.

Kesalahan rumus kuadrat Gaussian pada ruas tersebut adalah Untuk sisa suku rumusnya adalah dan koefisien α N menurun dengan cepat seiring dengan pertumbuhan N. Di Sini

Rumus Gaussian memberikan akurasi yang tinggi bahkan dengan jumlah node yang sedikit (dari 4 hingga 10). Dalam hal ini, dalam perhitungan praktis, jumlah node berkisar antara beberapa ratus hingga beberapa ribu. Perhatikan juga bahwa bobot kuadrat Gaussian selalu positif, yang menjamin stabilitas algoritma untuk menghitung jumlah

Metode kuadrat terkecil adalah salah satu yang paling umum dan paling berkembang karena sifatnya kesederhanaan dan efisiensi metode untuk memperkirakan parameter linier. Pada saat yang sama, ketika menggunakannya, beberapa kehati-hatian harus diperhatikan, karena model yang dibangun dengan menggunakannya mungkin tidak memenuhi sejumlah persyaratan untuk kualitas parameternya dan, sebagai akibatnya, tidak mencerminkan pola pengembangan proses dengan “baik”. cukup.

Mari kita perhatikan prosedur untuk memperkirakan parameter model ekonometrik linier menggunakan metode kuadrat terkecil secara lebih rinci. Model seperti itu secara umum dapat direpresentasikan dengan persamaan (1.2):

yt = a 0 + a 1 x 1 t +...+ an x ​​nt + ε t.

Data awal saat memperkirakan parameter a 0 , a 1 ,..., a n adalah vektor nilai variabel terikat kamu= (y 1 , y 2 , ... , y T)" dan matriks nilai variabel bebas

di mana kolom pertama, terdiri dari satuan, sesuai dengan koefisien model.

Metode kuadrat terkecil mendapatkan namanya berdasarkan prinsip dasar bahwa estimasi parameter yang diperoleh berdasarkan metode tersebut harus memenuhi: jumlah kuadrat kesalahan model harus minimal.

Contoh penyelesaian masalah dengan metode kuadrat terkecil

Contoh 2.1. Perusahaan perdagangan ini memiliki jaringan 12 toko, informasi kegiatannya disajikan pada Tabel. 2.1.

Manajemen perusahaan ingin mengetahui bagaimana jumlah tahunan bergantung pada ruang ritel toko.

Tabel 2.1

Nomor toko

Omset tahunan, juta rubel.

Area ritel, ribuan m2

Solusi kuadrat terkecil. Mari kita tunjukkan omset tahunan toko ke-th, juta rubel; — luas retail toko ke-th, ribuan m2.

Gambar.2.1. Plot sebar misalnya 2.1

Untuk menentukan bentuk hubungan fungsional antar variabel, kita akan membuat diagram sebar (Gbr. 2.1).

Berdasarkan diagram sebar, kita dapat menyimpulkan bahwa omset tahunan bergantung positif pada ruang ritel (yaitu, y akan meningkat seiring dengan meningkatnya ). Bentuk sambungan fungsional yang paling cocok adalah linier.

Informasi untuk perhitungan selanjutnya disajikan pada tabel. 2.2. Dengan menggunakan metode kuadrat terkecil, kami memperkirakan parameter model ekonometrik satu faktor linier

Tabel 2.2

Dengan demikian,

Oleh karena itu, dengan peningkatan ruang ritel sebesar 1.000 m2, semua hal lain dianggap sama, omset tahunan rata-rata meningkat sebesar 67,8871 juta rubel.

Contoh 2.2. Manajemen perusahaan memperhatikan bahwa omset tahunan tidak hanya bergantung pada area penjualan toko (lihat contoh 2.1), tetapi juga pada jumlah rata-rata pengunjung. Informasi yang relevan disajikan dalam tabel. 2.3.

Tabel 2.3

Larutan. Mari kita nyatakan jumlah rata-rata pengunjung toko ke-th per hari, ribuan orang.

Untuk menentukan bentuk hubungan fungsional antar variabel, kita akan membuat diagram sebar (Gbr. 2.2).

Berdasarkan diagram sebar, kita dapat menyimpulkan bahwa omzet tahunan bergantung positif pada jumlah rata-rata pengunjung per hari (yaitu, y akan meningkat seiring dengan meningkatnya ). Bentuk ketergantungan fungsional adalah linier.

Beras. 2.2. Plot sebar misalnya 2.2

Tabel 2.4

Secara umum, parameter model ekonometrik dua faktor perlu ditentukan

yt = a 0 + a 1 x 1 t + a 2 x 2 t + ε t

Informasi yang diperlukan untuk perhitungan lebih lanjut disajikan pada tabel. 2.4.

Mari kita perkirakan parameter model ekonometrik dua faktor linier menggunakan metode kuadrat terkecil.

Dengan demikian,

Perkiraan koefisien =61,6583 menunjukkan bahwa, jika hal-hal lain dianggap sama, dengan peningkatan ruang ritel sebesar 1.000 m 2, omset tahunan akan meningkat rata-rata 61,6583 juta rubel.

Yang paling banyak diterapkan dalam berbagai bidang ilmu pengetahuan dan kegiatan praktis. Bisa fisika, kimia, biologi, ekonomi, sosiologi, psikologi, dan lain sebagainya. Atas kehendak takdir, saya sering kali harus berurusan dengan perekonomian, oleh karena itu hari ini saya akan mengatur untuk Anda perjalanan ke negara menakjubkan bernama Ekonometrika=) ...Bagaimana bisa kamu tidak menginginkannya?! Sangat bagus di sana – Anda hanya perlu mengambil keputusan! ...Tetapi yang mungkin Anda inginkan adalah mempelajari cara memecahkan masalah metode kuadrat terkecil. Dan terutama pembaca yang rajin akan belajar menyelesaikannya tidak hanya secara akurat, tetapi juga SANGAT CEPAT ;-) Tapi pertama-tama pernyataan umum mengenai permasalahan tersebut+ contoh terlampir:

Mari kita pelajari indikator-indikator dalam suatu mata pelajaran tertentu yang memiliki ekspresi kuantitatif. Pada saat yang sama, ada banyak alasan untuk percaya bahwa indikator bergantung pada indikatornya. Asumsi ini dapat berupa hipotesis ilmiah atau berdasarkan akal sehat dasar. Namun, mari kita kesampingkan ilmu pengetahuan dan jelajahi area yang lebih menarik, yaitu toko kelontong. Mari kita nyatakan dengan:

– area ritel toko kelontong, m2,
– omset tahunan toko kelontong, juta rubel.

Jelas sekali bahwa semakin besar area toko, dalam banyak kasus, omzetnya akan semakin besar.

Misalkan setelah melakukan observasi/eksperimen/perhitungan/menari dengan rebana kita mempunyai data numerik:

Dengan toko kelontong, menurut saya semuanya sudah jelas: - ini area toko pertama, - omset tahunannya, - area toko ke-2, - omset tahunannya, dll. Omong-omong, sama sekali tidak perlu memiliki akses ke materi rahasia - penilaian omset perdagangan yang cukup akurat dapat diperoleh melalui statistik matematika. Namun, jangan sampai kita teralihkan, kursus spionase komersial sudah berbayar =)

Data tabel juga dapat ditulis dalam bentuk titik dan digambarkan dalam bentuk yang familiar sistem kartesius .

Mari kita jawab pertanyaan penting: Berapa banyak poin yang dibutuhkan untuk penelitian kualitatif?

Lebih besar lebih baik. Set minimum yang dapat diterima terdiri dari 5-6 poin. Selain itu, jika jumlah datanya kecil, hasil yang “anomali” tidak dapat dimasukkan ke dalam sampel. Jadi, misalnya, sebuah toko elit kecil bisa mendapatkan penghasilan yang jauh lebih besar daripada “rekan-rekannya”, sehingga mendistorsi pola umum yang perlu Anda temukan!

Sederhananya, kita perlu memilih suatu fungsi, jadwal yang melewati sedekat mungkin dengan titik-titik tersebut . Fungsi ini disebut memperkirakan (perkiraan - perkiraan) atau fungsi teoritis . Secara umum, “pesaing” yang jelas segera muncul di sini - polinomial tingkat tinggi, yang grafiknya melewati SEMUA titik. Namun opsi ini rumit dan seringkali salah. (karena grafik akan “berputar” sepanjang waktu dan tidak mencerminkan tren utama).

Dengan demikian, fungsi yang dicari harus cukup sederhana dan pada saat yang sama mencerminkan ketergantungan secara memadai. Seperti yang Anda duga, salah satu metode untuk menemukan fungsi tersebut disebut metode kuadrat terkecil. Pertama, mari kita lihat esensinya secara umum. Misalkan beberapa fungsi mendekati data eksperimen:


Bagaimana cara mengevaluasi keakuratan perkiraan ini? Mari kita hitung juga perbedaan (deviasi) antara nilai eksperimen dan nilai fungsional (kami mempelajari gambarnya). Pikiran pertama yang terlintas dalam pikiran adalah memperkirakan seberapa besar jumlahnya, namun masalahnya adalah perbedaannya bisa negatif (Misalnya, ) dan penyimpangan-penyimpangan akibat penjumlahan tersebut akan saling meniadakan. Oleh karena itu, sebagai perkiraan keakuratan perkiraan, perlu diambil jumlahnya modul penyimpangan:

atau runtuh: (jika ada yang tidak tahu: – ini adalah ikon penjumlahan, dan – variabel tambahan “penghitung”, yang mengambil nilai dari 1 hingga ).

Dengan memperkirakan titik-titik eksperimen dengan fungsi yang berbeda, kita akan memperoleh nilai yang berbeda, dan tentunya, jika jumlah ini lebih kecil, fungsi tersebut lebih akurat.

Metode seperti itu ada dan disebut metode modulus terkecil. Namun, dalam praktiknya, hal ini menjadi lebih luas metode kuadrat terkecil, di mana kemungkinan nilai negatif dihilangkan bukan dengan modul, tetapi dengan mengkuadratkan deviasi:

, setelah itu upaya diarahkan untuk memilih fungsi sedemikian rupa sehingga jumlah simpangan kuadrat adalah sekecil mungkin. Sebenarnya dari sinilah nama metode tersebut berasal.

Dan sekarang kita kembali ke poin penting lainnya: seperti disebutkan di atas, fungsi yang dipilih seharusnya cukup sederhana - tetapi ada juga banyak fungsi seperti itu: linier , hiperbolis, eksponensial, logaritma, kuadrat dll. Dan tentunya di sini saya ingin langsung “mengurangi bidang kegiatan”. Kelas fungsi manakah yang harus saya pilih untuk penelitian? Teknik primitif namun efektif:

– Cara termudah adalah dengan menggambarkan titik pada gambar dan menganalisis lokasinya. Jika mereka cenderung berjalan dalam garis lurus, maka Anda harus mencarinya persamaan suatu garis dengan nilai optimal dan . Dengan kata lain, tugasnya adalah mencari koefisien TERSEBUT sehingga jumlah simpangan kuadratnya paling kecil.

Jika titik-titiknya letaknya, misalnya sepanjang hiperbola, maka jelaslah bahwa fungsi linier akan memberikan perkiraan yang buruk. Dalam hal ini, kami mencari koefisien yang paling “menguntungkan” untuk persamaan hiperbola – yang memberikan jumlah kuadrat minimum .

Sekarang perhatikan bahwa dalam kedua kasus yang sedang kita bicarakan fungsi dua variabel, yang argumennya parameter ketergantungan yang dicari:

Dan pada dasarnya kita perlu memecahkan masalah standar - temukan fungsi minimum dua variabel.

Mari kita ingat contoh kita: misalkan titik-titik “penyimpanan” cenderung terletak pada garis lurus dan ada banyak alasan untuk mempercayai keberadaannya. ketergantungan linier omset dari ruang ritel. Mari kita cari koefisien TERSEBUT “a” dan “menjadi” sehingga merupakan jumlah deviasi kuadrat adalah yang terkecil. Semuanya seperti biasa - pertama Turunan parsial orde pertama. Berdasarkan aturan linearitas Anda dapat membedakannya tepat di bawah ikon penjumlahan:

Jika Anda ingin menggunakan informasi ini untuk esai atau makalah, saya akan sangat berterima kasih atas tautan dalam daftar sumber. Anda akan menemukan perhitungan mendetail di beberapa tempat:

Mari buat sistem standar:

Kami mengurangi setiap persamaan dengan "dua" dan, sebagai tambahan, "memecah" jumlahnya:

Catatan : menganalisis secara mandiri mengapa “a” dan “be” dapat dikeluarkan dari ikon penjumlahan. Ngomong-ngomong, secara formal ini bisa dilakukan dengan penjumlahan

Mari kita menulis ulang sistem dalam bentuk “terapan”:

setelah itu algoritma untuk memecahkan masalah kita mulai muncul:

Tahukah kita koordinat titik-titik tersebut? Kita tahu. Jumlah bisakah kita menemukannya? Dengan mudah. Mari kita buat yang paling sederhana sistem dua persamaan linear dalam dua hal yang tidak diketahui(“a” dan “menjadi”). Kami memecahkan sistem, misalnya, metode Cramer, sebagai hasilnya kita memperoleh titik stasioner. Memeriksa kondisi cukup untuk ekstrem, kita dapat memverifikasi bahwa pada titik ini fungsinya mencapai dengan tepat minimum. Pemeriksaan tersebut melibatkan perhitungan tambahan dan oleh karena itu kami akan meninggalkannya di belakang layar (jika perlu, bingkai yang hilang dapat dilihat). Kami menarik kesimpulan akhir:

Fungsi jalan terbaik (setidaknya dibandingkan dengan fungsi linier lainnya) mendekatkan titik percobaan . Secara kasar, grafiknya mendekati titik-titik ini. Dalam tradisi ekonometrika fungsi perkiraan yang dihasilkan juga disebut persamaan regresi linier berpasangan .

Masalah yang sedang dipertimbangkan sangat penting secara praktis. Dalam contoh situasi kita, Persamaan. memungkinkan Anda memprediksi perputaran perdagangan apa ("Igrek") toko akan memiliki nilai tertentu dari area penjualan (satu atau lain arti dari "x"). Ya, ramalan yang dihasilkan hanya berupa ramalan, namun dalam banyak kasus ternyata cukup akurat.

Saya akan menganalisis satu soal saja dengan bilangan “nyata”, karena tidak ada kesulitan di dalamnya - semua perhitungan berada pada level kurikulum sekolah kelas 7-8. Dalam 95 persen kasus, Anda akan diminta untuk mencari fungsi linier saja, tetapi di akhir artikel saya akan menunjukkan bahwa tidak sulit lagi mencari persamaan hiperbola optimal, eksponensial, dan beberapa fungsi lainnya.

Faktanya, yang tersisa hanyalah mendistribusikan barang yang dijanjikan - sehingga Anda dapat belajar memecahkan contoh-contoh tersebut tidak hanya secara akurat, tetapi juga dengan cepat. Kami mempelajari standar dengan cermat:

Tugas

Dari hasil mempelajari hubungan antara dua indikator, diperoleh pasangan angka sebagai berikut:

Dengan menggunakan metode kuadrat terkecil, temukan fungsi linier yang paling mendekati fungsi empiris (berpengalaman) data. Buatlah gambar untuk membuat titik-titik percobaan dan grafik fungsi aproksimasi dalam sistem koordinat persegi panjang Cartesian . Temukan jumlah deviasi kuadrat antara nilai empiris dan teoritis. Cari tahu apakah fiturnya lebih baik (dari sudut pandang metode kuadrat terkecil) mendekatkan titik percobaan.

Harap dicatat bahwa arti “x” adalah wajar, dan ini memiliki arti makna yang khas, yang akan saya bicarakan nanti; tapi tentu saja bisa juga pecahan. Selain itu, bergantung pada konten tugas tertentu, nilai "X" dan "permainan" bisa negatif seluruhnya atau sebagian. Ya, kami telah diberi tugas yang “tak berwajah”, dan kami memulainya larutan:

Kami menemukan koefisien fungsi optimal sebagai solusi sistem:

Agar pencatatan lebih ringkas maka variabel “counter” dapat dihilangkan, karena sudah jelas bahwa penjumlahan dilakukan dari 1 sampai .

Lebih mudah untuk menghitung jumlah yang diperlukan dalam bentuk tabel:


Penghitungan dapat dilakukan pada mikrokalkulator, tetapi lebih baik menggunakan Excel - lebih cepat dan tanpa kesalahan; tonton video singkatnya:

Jadi, kita mendapatkan yang berikut ini sistem:

Di sini Anda dapat mengalikan persamaan kedua dengan 3 dan kurangi suku ke-2 dari persamaan ke-1 dengan suku. Tapi ini adalah keberuntungan - dalam praktiknya, sistem seringkali bukan sebuah anugerah, dan dalam kasus seperti itu sistem menyelamatkan metode Cramer:
, yang berarti sistem memiliki solusi unik.

Mari kita periksa. Saya memahami bahwa Anda tidak menginginkannya, tetapi mengapa melewatkan kesalahan yang tidak dapat dilewatkan sama sekali? Mari kita substitusikan solusi yang ditemukan ke ruas kiri setiap persamaan sistem:

Ruas kanan persamaan yang bersesuaian diperoleh, yang berarti sistem diselesaikan dengan benar.

Jadi, fungsi aproksimasi yang diinginkan: – dari semua fungsi linier Dialah yang paling mendekati data eksperimen.

Berbeda dengan lurus ketergantungan omset toko terhadap luasnya, ketergantungan yang ditemukan adalah balik (prinsip “semakin banyak, semakin sedikit”), dan fakta ini langsung terungkap dari sisi negatifnya lereng. Fungsi memberitahu kita bahwa dengan kenaikan suatu indikator tertentu sebesar 1 satuan, maka nilai indikator terikatnya menurun rata-rata sebesar 0,65 unit. Seperti kata pepatah, semakin tinggi harga soba, semakin sedikit penjualannya.

Untuk memplot grafik fungsi aproksimasi, kita mencari dua nilainya:

dan jalankan gambarnya:


Garis lurus yang dibangun disebut garis tren (yaitu garis tren linier, yaitu pada kasus umum, suatu tren belum tentu berupa garis lurus). Semua orang pasti familiar dengan ungkapan “menjadi tren”, dan menurut saya istilah ini tidak memerlukan komentar tambahan.

Mari kita hitung jumlah simpangan kuadrat antara nilai empiris dan teoritis. Secara geometris, ini adalah jumlah kuadrat panjang segmen “raspberry”. (dua di antaranya sangat kecil sehingga tidak terlihat).

Mari kita rangkum perhitungannya dalam sebuah tabel:


Sekali lagi, ini bisa dilakukan secara manual; untuk berjaga-jaga, saya akan memberikan contoh untuk poin pertama:

tetapi jauh lebih efektif melakukannya dengan cara yang sudah diketahui:

Kami ulangi sekali lagi: Apa arti dari hasil yang diperoleh? Dari semua fungsi linier fungsi kamu indikatornya paling kecil, yaitu dalam keluarganya merupakan perkiraan terbaik. Dan di sini, omong-omong, pertanyaan terakhir dari masalah ini bukanlah suatu kebetulan: bagaimana jika fungsi eksponensial yang diusulkan apakah lebih baik mendekatkan titik percobaan?

Mari kita cari jumlah simpangan kuadrat yang sesuai - untuk membedakannya, saya akan melambangkannya dengan huruf "epsilon". Tekniknya sama persis:


Dan sekali lagi, untuk berjaga-jaga, perhitungan untuk poin pertama:

Di Excel kami menggunakan fungsi standar pengalaman (sintaks dapat ditemukan di Bantuan Excel).

Kesimpulan: , yang berarti bahwa fungsi eksponensial mendekati titik-titik eksperimen lebih buruk daripada garis lurus .

Namun di sini perlu dicatat bahwa yang “lebih buruk” adalah belum berarti, apa yang salah. Sekarang saya telah membuat grafik dari fungsi eksponensial ini - dan grafik tersebut juga mendekati titik - sedemikian rupa sehingga tanpa penelitian analitis sulit untuk mengatakan fungsi mana yang lebih akurat.

Ini menyimpulkan solusinya, dan saya kembali ke pertanyaan tentang nilai alami dari argumen tersebut. Dalam berbagai penelitian, biasanya ekonomi atau sosiologi, “X” alami digunakan untuk menghitung bulan, tahun, atau interval waktu lain yang setara. Misalnya saja permasalahan berikut ini.

Perkiraan data eksperimen adalah suatu metode yang didasarkan pada penggantian data yang diperoleh secara eksperimen dengan fungsi analitik yang paling mendekati atau bertepatan pada titik nodal dengan nilai aslinya (data yang diperoleh selama suatu percobaan atau percobaan). Saat ini, ada dua cara untuk mendefinisikan fungsi analitik:

Dengan membuat polinomial interpolasi derajat n yang lolos langsung melalui semua titik kumpulan data tertentu. Dalam hal ini, fungsi aproksimasi disajikan dalam bentuk: polinomial interpolasi dalam bentuk Lagrange atau polinomial interpolasi dalam bentuk Newton.

Dengan membuat polinomial aproksimasi derajat n yang lolos dalam jarak terdekat dengan titik dari array data tertentu. Dengan demikian, fungsi perkiraan memuluskan semua gangguan acak (atau kesalahan) yang mungkin timbul selama percobaan: nilai yang diukur selama percobaan bergantung pada faktor acak yang berfluktuasi menurut hukum acaknya sendiri (kesalahan pengukuran atau instrumen, ketidakakuratan atau eksperimen). kesalahan). Dalam hal ini, fungsi aproksimasi ditentukan dengan menggunakan metode kuadrat terkecil.

Metode kuadrat terkecil(dalam literatur berbahasa Inggris Ordinary Least Squares, OLS) adalah metode matematika yang didasarkan pada penentuan fungsi perkiraan, yang dibangun paling dekat dengan titik-titik dari serangkaian data eksperimen tertentu. Kedekatan fungsi asli dan fungsi aproksimasi F(x) ditentukan dengan ukuran numerik, yaitu: jumlah simpangan kuadrat data eksperimen dari kurva aproksimasi F(x) harus yang terkecil.

Perkiraan kurva dibuat menggunakan metode kuadrat terkecil

Metode kuadrat terkecil yang digunakan:

Untuk menyelesaikan sistem persamaan overdetermined ketika jumlah persamaan melebihi jumlah persamaan yang tidak diketahui;

Untuk menemukan solusi dalam kasus sistem persamaan nonlinier biasa (tidak ditentukan secara berlebihan);

Untuk memperkirakan nilai titik dengan beberapa fungsi perkiraan.

Fungsi aproksimasi dengan metode kuadrat terkecil ditentukan dari kondisi jumlah minimum simpangan kuadrat dari fungsi aproksimasi yang dihitung dari serangkaian data eksperimen tertentu. Kriteria metode kuadrat terkecil ini ditulis sebagai ekspresi berikut:

Nilai fungsi perkiraan yang dihitung pada titik nodal,

Kumpulan data eksperimen tertentu pada titik nodal.

Kriteria kuadrat memiliki sejumlah sifat “baik”, seperti diferensiasi, memberikan solusi unik terhadap masalah aproksimasi dengan fungsi aproksimasi polinomial.

Bergantung pada kondisi soal, fungsi aproksimasinya adalah polinomial berderajat m

Derajat fungsi aproksimasi tidak bergantung pada jumlah titik nodal, tetapi dimensinya harus selalu lebih kecil dari dimensi (jumlah titik) larik data eksperimen tertentu.

∙ Jika derajat fungsi aproksimasinya adalah m=1, maka fungsi tabel tersebut kita aproksimasi dengan garis lurus (regresi linier).

∙ Jika derajat fungsi aproksimasinya adalah m=2, maka fungsi tabel tersebut kita aproksimasi dengan parabola kuadrat (perkiraan kuadrat).

∙ Jika derajat fungsi aproksimasinya adalah m=3, maka fungsi tabel tersebut kita aproksimasi dengan parabola kubik (pendekatan kubik).

Dalam kasus umum, ketika perlu membuat polinomial aproksimasi derajat m untuk nilai tabel tertentu, kondisi minimum jumlah simpangan kuadrat pada semua titik nodal ditulis ulang dalam bentuk berikut:

- koefisien yang tidak diketahui dari polinomial aproksimasi derajat m;

Jumlah nilai tabel yang ditentukan.

Kondisi yang diperlukan untuk keberadaan minimum suatu fungsi adalah persamaan turunan parsialnya dengan nol terhadap variabel yang tidak diketahui . Hasilnya, kita memperoleh sistem persamaan berikut:

Mari kita ubah sistem persamaan linier yang dihasilkan: buka tanda kurung dan pindahkan suku bebasnya ke sisi kanan ekspresi. Hasilnya, sistem ekspresi aljabar linier yang dihasilkan akan ditulis dalam bentuk berikut:

Sistem ekspresi aljabar linier ini dapat ditulis ulang dalam bentuk matriks:

Hasilnya, diperoleh sistem persamaan linier berdimensi m+1, yang terdiri dari m+1 yang tidak diketahui. Sistem ini dapat diselesaikan dengan menggunakan metode apa pun untuk menyelesaikan persamaan aljabar linier (misalnya metode Gaussian). Sebagai hasil dari penyelesaian, akan ditemukan parameter fungsi perkiraan yang tidak diketahui yang memberikan jumlah minimum deviasi kuadrat fungsi perkiraan dari data asli, yaitu. perkiraan kuadrat terbaik. Perlu diingat bahwa jika hanya satu nilai dari data awal yang berubah, semua koefisien akan mengubah nilainya, karena nilai tersebut sepenuhnya ditentukan oleh data awal.

Perkiraan data awal dengan ketergantungan linier

(regresi linier)

Sebagai contoh, mari kita perhatikan teknik menentukan fungsi aproksimasi, yang dinyatakan dalam bentuk ketergantungan linier. Sesuai dengan metode kuadrat terkecil, syarat minimum jumlah simpangan kuadrat ditulis dalam bentuk berikut:

Koordinat node tabel;

Koefisien fungsi perkiraan yang tidak diketahui, yang ditetapkan sebagai ketergantungan linier.

Kondisi yang diperlukan untuk keberadaan minimum suatu fungsi adalah persamaan turunan parsialnya dengan nol terhadap variabel yang tidak diketahui. Hasilnya, kita memperoleh sistem persamaan berikut:

Mari kita ubah sistem persamaan linier yang dihasilkan.

Kami memecahkan sistem persamaan linear yang dihasilkan. Koefisien fungsi aproksimasi dalam bentuk analitik ditentukan sebagai berikut (metode Cramer):

Koefisien ini memastikan konstruksi fungsi aproksimasi linier sesuai dengan kriteria meminimalkan jumlah kuadrat fungsi aproksimasi dari nilai tabel yang diberikan (data eksperimen).

Algoritma untuk menerapkan metode kuadrat terkecil

1. Data awal:

Array data eksperimen dengan jumlah pengukuran N ditentukan

Derajat aproksimasi polinomial (m) ditentukan

2. Algoritma perhitungan:

2.1. Koefisien untuk membangun sistem persamaan dengan dimensi ditentukan

Koefisien sistem persamaan (sisi kiri persamaan)

- indeks nomor kolom matriks persegi sistem persamaan

Suku bebas suatu sistem persamaan linear (sisi kanan persamaan)

- indeks nomor baris matriks persegi sistem persamaan

2.2. Pembentukan sistem persamaan linear berdimensi .

2.3. Memecahkan sistem persamaan linier untuk menentukan koefisien yang tidak diketahui dari polinomial aproksimasi derajat m.

2.4.Penentuan jumlah simpangan kuadrat polinomial aproksimasi dari nilai aslinya di semua titik nodal

Nilai yang ditemukan dari jumlah simpangan kuadrat adalah yang seminimal mungkin.

Perkiraan menggunakan fungsi lain

Perlu dicatat bahwa ketika memperkirakan data asli sesuai dengan metode kuadrat terkecil, fungsi logaritma, fungsi eksponensial, dan fungsi pangkat terkadang digunakan sebagai fungsi perkiraan.

Perkiraan logaritma

Mari kita pertimbangkan kasus ketika fungsi perkiraan diberikan oleh fungsi logaritma dalam bentuk: