Phương pháp dò mạch phi tuyến tiếng anh là gì năm 2024

Điện trở quang hay quang trở, photoresistor, photocell, LDR (viết tắt tiếng Anh: Light-dependent resistor), là linh kiện điện tử chế tạo bằng chất đặc biệt có điện trở thay đổi giảm theo mức ánh sáng chiếu vào. Đó là điện trở phi tuyến, phi ohmic.

Quang trở được dùng làm cảm biến nhạy sáng trong các mạch dò, ví dụ trong máy đo ánh sáng khi chụp ảnh, trong mạch xác định mức sáng tối của môi trường để kích hoạt đóng cắt đèn chiếu sáng tự động.

Nguyên lý hoạt động[sửa | sửa mã nguồn]

Quang trở làm bằng chất bán dẫn trở kháng cao và không có tiếp giáp nào. Trong bóng tối, quang trở có điện trở đến vài MΩ. Khi có ánh sáng, điện trở giảm xuống mức một vài trăm Ω .

Hoạt động của quang trở dựa trên hiệu ứng quang điện trong khối vật chất. Khi photon có năng lượng đủ lớn đập vào, sẽ làm bật electron khỏi phân tử, trở thành tự do trong khối chất và làm chất bán dẫn thành dẫn điện. Mức độ dẫn điện tuỳ thuộc số photon được hấp thụ.

Tuỳ thuộc chất bán dẫn mà quang trở phản ứng khác nhau với bước sóng photon khác nhau. Quang trở phản ứng trễ hơn điốt quang, cỡ 10 ms, nên nó tránh được thay đổi nhanh của nguồn sáng .

Các vật liệu dùng cho chế tạo quang trở có:

  • Cadmi sulfide (CdS) và Cadmi selenide (CdSe), nhưng tại châu Âu đang cấm dùng cadmi.
  • Chì(II) sulfide (PbS) và Indi antimonua (InSb) được sử dụng cho vùng phổ hồng ngoại.
  • Gecu là cảm biến dò hồng ngoại xa tốt nhất, được sử dụng trong thiên văn hồng ngoại và quang phổ hồng ngoại.

Ứng dụng[sửa | sửa mã nguồn]

Quang trở được dùng làm cảm biến nhạy sáng trong các mạch dò sáng tối để đóng cắt đèn chiếu sáng.

Dàn nhạc có guitar điện thì dùng quang trở để nhận biết độ sáng từ dàn đèn màu nhạc để tạo hiệu ứng âm thanh.

Trong thiên văn hồng ngoại và quang phổ hồng ngoại, hợp chất Gecu được chế thành bảng photocell làm cảm biến ảnh.

  • 1. GIA TP. HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN ĐỨC MINH ĐIỀU KHIỂN TRƯỢT THÍCH NGHI HỆ THỐNG ĐỘNG PHI TUYẾN LUẬN ÁN TIẾN SĨ KỸ THUẬT TP. HỒ CHÍ MINH NĂM 2012
  • 2. GIA TP. HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN ĐỨC MINH ĐIỀU KHIỂN TRƯỢT THÍCH NGHI HỆ THỐNG ĐỘNG PHI TUYẾN Chuyên ngành: TỰ ĐỘNG HÓA Mã số chuyên ngành: 6252600 Phản biện độc lập 1: GS.TSKH NGUYỄN XUÂN QUỲNH Phản biện độc lập 2: PGS.TS NGUYỄN NGỌC PHƯƠNG Phản biện 1: TS. NGUYỄN CHÍ NGÔN Phản biện 2: PGS.TSKH HỒ ĐẮC LỘC Phản biện 3: PGS.TS NGUYỄN TẤN TIẾN NGƯỜI HƯỚNG DẪN KHOA HỌC 1. PGS. TS DƯƠNG HOÀI NGHĨA 2. TS NGUYỄN ĐỨC THÀNH
  • 3. giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả. Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, và không sao chép từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu (nếu có) đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng theo yêu cầu. Tác giả luận án __________________________________ Nguyễn Đức Minh
  • 4. with sliding mode or Sliding Mode Control is well- known as a simple but effective robust non-linear control method. This method has many advanced features such as good performance and robustness against parameter variations. However, because of the switching of the control signal, there is a high frequency oscillation of the phase portrait around the sliding surface. Furthermore, designing SMC requires an upper bound of the model uncertainty. The model uncertainty often consists of the non-model dynamic and the variation of the plant parameters. If the actual modelling error exceeds the uncertainty upper bound used to design the controller, the system stability will not be guaranteed. In addition, like traditional control methods, designing SMC requires a mathematical model of the plant. The control performance may be deteriorated in case of imprecise or time varying model parameters. This work aims to study a neural network based adaptive sliding mode controller for uncertain non-linear dynamical system. It consists of three main points: - The combination of neural networks and the sliding mode control theory to design an adaptive sliding mode controller for uncertain non-linear dynamical systems. This new controller can be characterized by: (i) it is a direct neural network controller; (ii) the controller is identified on line without need of initial model, (iii) it has the ability to adjust itself to cope with the variations of the upper bounds of the uncertainty and it is noise insensitive. - The development of the adaptive sliding mode controller mentioned above to the Decoupled Adaptive Sliding Mode Controller DANSMC for multivariable non- linear systems. - The proposed controller has been successfully tested with an inverted rotary pendulum and an inverted two-dimensional pendulum through simulations and experiments. Main results
  • 5. sliding mode controller consists of two components: the equivalent controller and the robust controller; it has a smooth form, it can overcome the chattering phenomenon and it is appropriate for training the neural network. - The update-law for one hidden layer feed forward neural network has been carried out based on Lyapunov stability theory, which involves two feedback signals: sliding surface signal and its derivative. The neural network can be trained online without need of plant model nor its uncertainty upper bound. - It is shown that the proposed neural network controller can completely replace the traditional sliding mode controller. By using the system states as inputs instead of sliding surface signals, DANSMC exploits the ability of neural network. Simulation results also show that the system can self-develop to improve the control performance. - Theories and simulations show that the DNSMC controller can adjust itself to adapt to the variations of the plant as well as its uncertainty.
  • 6. ÁN Điều khiển có cấu trúc thay đổi VSC (Variable Structure Control) với chế độ trượt, hay điều khiển trượt SMC (Sliding Mode Control) được biết đến như là một phương pháp điều khiển phi tuyến bền vững đơn giản, hiệu quả. Phương pháp điều khiển này có nhiều ưu điểm như: (i) ít nhạy với sự biến thiên của các thông số của hệ thống; (ii) có khả năng chống nhiễu tốt; (iii) đáp ứng động học nhanh. Tuy nhiên do tín hiệu điều khiển trượt cổ điển có dạng chuyển mạch nên tồn tại hiện tượng dao động có tần số cao (chattering) của các quỹ đạo pha xung quanh mặt trượt. Hơn nữa, khi thiết kế điều khiển SMC yêu cầu phải biết trước giá trị chặn trên của các thành phần bất định của hệ thống. Các thành phần bất định thường bao gồm các thành phần động học không mô hình, sự biến thiên của các thông số và nhiễu loạn. Nếu giá trị chặn trên thực vượt quá giá trị chặn trên được giả thiết trong khi thiết kế bộ điều khiển, sự ổn định của hệ thống sẽ không được bảo đảm. Ngoài ra cũng giống như các phương pháp điều khiển kinh điển khác, việc thiết kế bộ điều khiển trượt yêu cầu phải biết mô hình toán học cùng các thông số của mô hình của đối tượng. Điều này sẽ ảnh hưởng tới chất lượng điều khiển trong một số ứng dụng mà ở đó mô hình toán học của đối tượng được điều khiển khó xác định một cách chính xác và các thông số có tầm biến thiên rộng. Luận án tiến sĩ nghiên cứu phương pháp điều khiển trượt thích nghi dùng mạng nơ-ron áp dụng cho hệ phi tuyến động bất định không rõ thông số mô hình với ba nội dung chính: Kết hợp lý thuyết điều khiển trượt và mạng nơ-ron để thiết kế bộ điều khiển trượt thích nghi dùng mạng nơ-ron áp dụng cho hệ thống phi tuyến động bất định không rõ thông số mô hình. Bộ điều khiển mới có các đặc điểm: (i) là một mạng nơ-ron được dùng làm bộ điều khiển trực tiếp; (ii) không cần nhận dạng trước các thông số của mô hình đối tượng, luật điều khiển được suy ra trực tiếp trong quá trình huấn luyện trực tuyến; (iii) có khả năng thích nghi trước sự thay đổi của các chặn trên của các thành phần bất định và có khả năng kháng nhiễu tốt. Phát triển bộ điều khiển trượt thích nghi nêu trên thành bộ điều khiển trượt thích nghi phân ly DANSMC cho hệ phi tuyến đa biến. Áp dụng các nghiên cứu về điều khiển trượt thích nghi phân ly lên hệ con lắc ngược xoay và con lắc ngược hai chiều thông qua mô phỏng và thực nghiệm.
  • 7. đạt được của luận án - Luật điều khiển trượt được đề nghị trong luận án bao gồm cả hai thành phần điều khiển tương đương và điều khiển bền vững, có dạng hàm trơn, có khả năng khắc phục được hiện tượng chattering và phù hợp để huấn luyện cho mạng nơ-ron. - Luật cập nhật cho mạng nơ-ron truyền thẳng một lớp ẩn được đề nghị dựa trên lý thuyết ổn định của Lyapunov với hai tín hiệu hồi tiếp bao gồm tín hiệu mặt trượt và đạo hàm của nó đã được chứng minh là đáp ứng được yêu cầu của luật điều khiển trượt được đề nghị và có khả năng huấn luyện trực tuyến cho mạng nơ-ron trở thành bộ điều khiển trượt thích nghi mà không cần phải nhận dạng trước các thông số của đối tượng và các giá trị chặn trên của các thành phần bất định của hệ thống. - Với mô hình điều khiển được đề nghị trong luận án mạng nơ-ron truyền thẳng một lớp ẩn đã thay thế hoàn toàn bộ điều khiển trượt. Với đặc điểm ngõ vào của mạng là các biến trạng thái (khác với ngõ vào là tín hiệu mặt trượt như một số phương pháp điều khiển trượt dùng mạng nơ-ron khác), phương pháp DANSMC đã khai thác được khả năng nhớ theo trạng thái của mạng nơ-ron và qua các kết quả mô phỏng đã cho thấy khả năng tự nâng cấp chất lượng điều khiển của hệ thống qua từng phiên điều khiển. - Lý thuyết và mô phỏng cũng đã cho thấy khả năng tự thay đổi để thích nghi của bộ điều khiển DANSMC trước sự thay đổi của các thông số của đối tượng cũng như các chặn trên của các thành phần bất định.
  • 8. xin tỏ lòng biết ơn sâu sắc đến PGS. TS Dương Hoài Nghĩa và TS. Nguyễn Đức Thành, hai người thầy đã hướng dẫn tận tình trong suốt thời gian tôi làm nghiên cứu sinh tại Đại học Bách Khoa. Những gợi ý đúng lúc hết sức quý báu cùng những ý kiến phản biện sâu sắc của các thầy đã giúp tôi nhận thức, định hướng đúng và hoàn thiện nghiên cứu của mình. Trong những năm cùng làm nghiên cứu với các thầy, tôi không chỉ học được các phương pháp nghiên cứu khoa học mà còn học được nhiều điều về tư cách, đạo đức trong cuộc sống Xin chân thành cảm ơn các thầy cô Bộ môn Tự Động ĐHBK TPHCM vì đã truyền đạt cho tôi những kiến thức nền tảng hết sức quý báu trong thời gian tôi còn học cao học, cũng như những góp ý khoa học và những phản biện thẳng thắn trong khi tôi thực hiện các chuyên đề tiến sĩ là những cơ sở hết sức có giá trị giúp tôi hoàn chỉnh luận án của mình. Xin cảm ơn vợ, và các con tôi đã cùng chia xẻ trong những ngày khó khăn nhất cả về vật chất và tinh thần để tôi có thể yên tâm thực hiện luận án này. Xin gửi lời cảm ơn đến các đồng nghiệp là các giảng viên của Khoa tin học trường Đại học Yersin và bạn bè thân hữu, những người luôn giúp đỡ và động viên tôi trong những năm tháng làm luận án. Mặc dù đã cố gắng hết sức nhưng luận án không tránh khỏi những thiếu xót. Tác giả rất mong được sự góp ý của quý thầy cô và các bạn đồng nghiệp.
  • 9. QUAN .........................................................................................................1 1.1 Đặt vấn đề..........................................................................................................1 1.2 Mục tiêu và phương pháp nghiên cứu của luận án............................................4 2 LÝ THUYẾT CƠ SỞ..............................................................................................8 2.1 Lý thuyết điều khiển trượt.................................................................................9 2.1.1 Đối tượng điều khiển ..................................................................................9 2.1.2 Mặt trượt .....................................................................................................9 2.1.3 Luật điều khiển trượt kinh điển ................................................................10 2.1.4 Điều khiển trượt cho hệ thống MIMO......................................................12 2.1.5 Đặc điểm của điều khiển trượt..................................................................14 2.2 Xấp xỉ hàm của mạng nơ-ron truyền thẳng.....................................................15 2.3 Một số mô hình điều khiển trượt dùng mạng nơ-ron ......................................18 2.3.1 Mô hình sử dụng mạng nơ-ron làm thành phần điều khiển tương đương 19 2.3.2 Mô hình điều khiển trượt phân ly dùng mạng nơ-ron ..............................20 3 ĐIỀU KHIỂN TRƯỢT THÍCH NGHI PHÂN LY DÙNG MẠNG NƠ-RON ....28 3.1 Điều khiển trượt thích nghi dùng mạng nơ-ron...............................................28 3.1.1 Mô tả bộ điều khiển ..................................................................................28 3.1.2 Luật cập nhật thích nghi để huấn luyện mạng..........................................29 3.2 Điều khiển trượt thích nghi phân ly dùng mạng nơ-ron DANSMC................33 4 KẾT QUẢ MÔ PHỎNG VÀ THỰC NGHIỆM...................................................38 4.1 Điều khiển trượt thích nghi phân ly con lắc ngược hai bậc xoay tự do ..........38 4.1.1 Mô tả con lắc ngược xoay.........................................................................38 4.1.2 Phân tích điều khiển..................................................................................39 4.1.3 Mô tả quá trình và các kết quả mô phỏng.................................................42 4.1.4 Mô tả quá trình và các kết quả thực nghiệm.............................................56 4.2 Điều khiển trượt thích nghi phân ly con lắc hai chiều.....................................66 5 KẾT LUẬN...........................................................................................................73 6 CÁC TÀI LIỆU CÔNG BỐ CỦA TÁC GIẢ .......................................................77 7 Tài liệu tham khảo.................................................................................................78
  • 10. HÌNH ẢNH Hình 2-1 Tín hiệu điều khiển trượt có dạng chuyển mạch ...........................................14 Hình 2-2 Mô phỏng quỹ đạo pha và hiện tượng chattering ..........................................15 Hình 2-3 Mạng nơ-ron một lớp ẩn trong bộ điều khiển DNNSMC..............................23 Hình 2-4 Hệ thống DNNSMC của Lon-Chen Hung và Hung Yuan Chung.................24 Hình 2-5 Mô hình điều khiển trượt phân ly dùng thuật toán SPSA..............................25 Hình 2-6 Đáp ứng góc con lắc ngược của điều khiển DNNSMC so với DFSM..........25 Hình 3-1 Mạng nơ-ron dùng làm bộ điều khiển ...........................................................29 Hình 3-2 Mô hình điều khiển trượt thích nghi phân ly.................................................35 Hình 4-1 Mô hình con lắc ngược xoay .........................................................................39 Hình 4-2 Mô hình con lắc ngược trên simulink............................................................41 Hình 4-3 Mô phỏng điều khiển DANSMC lên con lắc ngược xoay.............................41 Hình 4-4 Mô phỏng điều khiển DNNSMC lên con lắc ngược xoay trong 10s đầu tiên .......................................................................................................................................45 Hình 4-5 Mô phỏng điều khiển DNNSMC lên con lắc ngược xoay trong 0.5s đầu tiên .......................................................................................................................................46 Hình 4-6 Đáp ứng của tín hiệu mặt trượt của điều khiển DNNSMC ...........................47 Hình 4-7 Quỹ đạo pha các biến trạng thái của điều khiển DNNSMC..........................48 Hình 4-8 Quỹ đạo pha các biến trạng thái của điều khiển DNNSMC trong quá trình quá độ............................................................................................................................49 Hình 4-9 Quá trình huấn luyện và hội tụ bộ điều khiển DANSMC .............................50 Hình 4-10 Đáp ứng của tín hiệu trượt qua các phiên huấn luyện của điều khiển DANSMC......................................................................................................................51 Hình 4-11 Đáp ứng của điều khiển DANSMC.............................................................52 Hình 4-12 Đáp ứng của tín hiệu mặt trượtcủa điều khiển DASMC .............................53 Hình 4-13 Quỹ đạo pha các biến trạng thái của điều khiển DANSMC........................54 Hình 4-14 So sánh đáp ứng của điều khiển DNNSMC và DANSMC .........................55 Hình 4-15 Kết cấu phần cứng mô hình thực nghiệm để điều khiển trượt thích nghi phân ly con lắc ngược xoay dùng mạng nơ-ron............................................................57 Hình 4-16 Mô hình thực con lắc ngược trong phòng thí nghiệm .................................58 Hình 4-17 Sơ đồ khối chip vi điều khiển TMS320 2812..............................................59 Hình 4-18 Đáp ứng của trong 30 giây.(lật lên và ổn định) .........................................62 Hình 4-19 Đáp ứng của trong 30 giây..........................................................................62 Hình 4-20 Tín hiệu điều khiển u trong 30 giây.............................................................63 Hình 4-21 Đáp ứng của góc khi thay đổi khối lượng và chiều dài con lắc..................64 Hình 4-22 Đáp ứng của góc khi thay đổi khối lượng và chiều dài con lắc..................65 Hình 4-23 Con lắc ngược hai chiều ..............................................................................66 Hình 4-24 Biểu diễn hệ tọa độ con lắc ngược hai chiều ...............................................67 Hình 4-25 Mô hình điều khiển DANSMC cho con lắc ngược hai chiều......................69 Hình 4-26 Kết quả phiên huấn luyện thứ nhất..............................................................70 Hình 4-27 Kết quả của phiên huấn luyện thứ hai .........................................................70 Hình 4-28 Quỹ đạo x-y của phiên huấn luyện thứ nhất và thứ hai...............................71 Hình 4-29 Mô phỏng với biên độ nhiễu biến thiên.......................................................71 Hình 4-30 Mô phỏng với biên độ nhiễu biến thiên mạnh.............................................72
  • 11. BIỂU Bảng 1 Bộ trọng số thu được sau phiên huấn luyện đầu tiên........................................43 Bảng 2 Bộ trọng số thu được sau phiên huấn luyện cuối..............................................44
  • 12. TỪ VIẾT TẮT VÀ THUẬT NGỮ ĐỐI CHIẾU ANSMC (Adapative Neural Sliding Mode Control): Điều khiển trượt thích nghi dùng mạng nơ-ron CCS (Code Composer Studio): phần mềm hỗ trợ lập trình và giao tiếp với bo mạch xử lý tín hiệu số Chattering: Hiện tượng dao động xung quanh mặt trượt DANSMC (Decoupled Adaptive Neural Sliding Mode Control): Điều khiển trượt thích nghi phân ly dùng mạng nơ-ron DNNSMC (Decoupled Neural Network Sliding Mode Control): Điều khiển trượt phân ly dùng mạng nơ-ron DSP ( Digital Signal Processing): Xử lý tín hiệu số Lyapunov: Lý thuyết ổn định được phát biểu bởi Lyapunov NN (Neural Network): Mạng nơ-ron SMC (Sliding Mode Control): Điều khiển trượt SHL (Single Hidden Layer): Mạng nơ-ron một lớp ẩn RBFN (Radial Basic Funtion Network): Mạng hàm cơ sở xuyên tâm MLP (Multiple Layer Perceptron): Mạng nơ-ron nhiều lớp Perceptron: Một đơn vị trong mạng nơ-ron Swinging up: Điều khiển lật lên (cho con lắc ngược) Sliding surface : mặt trượt VSC (Variable Structure Control): điều khiển có cấu trúc thay đổi
  • 13. Đặt vấn đề Giới thiệu về điều khiển trượt Điều khiển trượt là một phương pháp điều khiển phi tuyến đơn giản hiệu quả, dựa vào hồi tiếp các biến trạng thái của hệ thống. Bộ điều khiển được thiết kế sao cho các trạng thái của hệ thống luôn luôn hướng về một mặt phẳng Hurwitz của các trạng thái, một khi các trạng thái đã nằm trên mặt trượt thì chúng sẽ tiến về gốc tọa độ. Vì vậy mục đích điều khiển ổn định trạng thái trở thành điều khiển ổn định tiệm cận các trạng thái bám trên mặt trượt. Điều khiển trượt có hai thành phần là thành phần điều khiển tương đương và thành phần điều khiển bền vững. Thành phần điều khiển bền vững mà trong nhiều tài liệu còn gọi là thành phần điều khiển hiệu chỉnh có nhiệm vụ chính là điều khiển quỹ đạo các trạng thái hướng về mặt trượt. Khi quỹ đạo các trạng thái đã ở lân cận mặt trượt thì thành phần điều khiển tương đương có tác dụng điều khiển các trạng thái bám chặt trên mặt trượt. Để thiết kế thành phần điều khiển tương đương trong điều khiển trượt cần phải biết rõ các hàm toán học phi tuyến của mô hình đối tượng và để thiết kế thành phần điều khiển bền vững trong điều khiển trượt thì cần phải biết các chặn trên của các thành phần bất định của mô hình. Trong đó các dạng của thành phần bất định của hệ thống bao gồm: nhiễu ảnh hưởng lên hệ thống, nhiễu đo đạc, và sai số mô hình do các thông số của đối tượng biến thiên theo thời gian. Ưu điểm của điều khiển trượt là nó ít nhạy với sự biến động của các thông số của mô hình và ảnh hưởng của nhiễu bên ngoài. Điều khiển trượt đã được áp dụng khá thành công để thiết kế các bộ điều khiển bền vững trong phòng thí nghiệm và ứng dụng rộng rãi trong thực tiễn. Một số vấn đề của điều khiển trượt cổ điển Tuy nhiên khi thiết kế các bộ điều khiển trượt có một số vấn đề thường gặp phải như sau:
  • 14. điều khiển bền vững trong điều khiển trượt có dạng hàm dấu kết hợp với hiện tượng trễ vật lý của các đối tượng gây nên hiện tượng chattering các trạng thái xung quanh mặt trượt. Thông thường để hạn chế hiện tượng chattering người thường thay thế hàm dấu trong thành phần điều khiển bền vững bằng hàm bão hòa. - Việc xác định các giá trị chặn trên của các thành phần bất định thường không chính xác. Người ta thường dùng các giá trị hằng để ước lượng các giá trị này. Khi thiết kế thành phần điều khiển bền vững, nếu việc chọn giá trị chặn trên quá lớn sẽ làm gia tăng hiện tượng chattering, làm tổn hao năng lượng điều khiển không cần thiết và xảy ra nhiều hiện tượng không mong muốn. Còn khi giá trị chặn trên thực lớn hơn giá trị chặn trên theo thiết kế thì hệ thống sẽ mất tính ổn định. Bài toán điều khiển trượt khi áp dụng cho các hệ thống đa biến là một bài toán khá phức tạp. Trong tài liệu [1] được giới thiệu năm 2000 dựa trên nhiều nghiên cứu trước đó, Utkin đã giới thiệu một số các phương pháp thiết kế các bộ điều khiển trượt phân ly áp dụng được cho các hệ thống phi tuyến bậc bốn. Các phương trình vi phân biểu diễn mô hình động học của đối tượng được đề nghị biến đổi để đưa về dạng hệ phương trình chuẩn đã được định nghĩa trước đó. Sau đó bài toán phân ly biến số được giải quyết dựa trên việc xét từng trường hợp riêng với một loạt các phép biến đổi toán học và chỉ có thể áp dụng lên từng đối tượng cụ thể chứ không có phương pháp biến đổi tổng quát. Các nghiên cứu đã được thực hiện phân tích mô hình động học và thiết kế bộ điều khiển phân ly các đối tượng phi tuyến có độ bất ổn cao như hệ xe con lắc Thành phần ñiều khiển tương ñương Thành phần ñiều khiển bền vững Luật ñiều khiển trượt cổ ñiển Thông số ñối tượng phi tuyến thông qua nhận dạng Thông số, mô hình nhiễu và các chặn trên của các thành phần bất ñịnh Hình 1-1 Các thành phần của điều khiển trượt cổ điển
  • 15. con lắc đôi và hệ con lắc xoay hai bậc tự do. Tuy nhiên, các bài toán cho thấy độ phức tạp cao và không dễ dàng thành công nếu áp dụng lên những đối tượng phi tuyến khác. Điều khiển trượt thích nghi dùng mạng nơ-ron Trong những năm gần đây ứng dụng khả năng học được để xấp xỉ thích nghi các hàm phi tuyến, một số nghiên cứu đã sử dụng mạng nơ-ron hoặc nơ-ron mờ để thay thế một phần hoặc hoàn toàn bộ điều khiển trượt cổ điển. Thông thường để thiết kế thành phần điều khiển tương đương của điều khiển trượt cổ điển cần phải nhận dạng trước các thông số của mô hình đối tượng. Nhận dạng thông số mô hình đối tượng thường phức tạp (có khi không thực hiện được) nhất là đối với các đối tượng có tính phi tuyến và độ bất ổn cao. Tín hiệu điều khiển sau khi thiết kế không như mong muốn do sai số nhận dạng và thường phải bù sai số nhận dạng bằng các phương pháp điều khiển thích nghi. Ưu điểm của các bộ điều khiển trượt dùng mạng nơ-ron là không cần biết trước các thông số cũng như các chặn trên của các hàm phi tuyến của mô hình động học, và hạn chế được hiện tượng chattering so với điều khiển trượt cổ điển. Trong một số nghiên cứu [2], [3], [4], [5], [6] [7] thành phần điều khiển bền vững được tách ra và hoạt động ở vùng xa mặt trượt, còn ở lân cận mặt trượt thì mạng nơ- ron hoặc nơ-ron mờ được dùng để thay thế thành phần điều khiển tương đương của điều khiển trượt cổ điển. Trong một số nghiên cứu khác [8], [9], [10] hàm dấu trong thành phần điều khiển bền vững được thay thế bằng hàm bão hòa để hạn chế hiện tượng chattering và mạng nơ-ron hoặc nơ-ron mờ cũng được dùng để thay thành phần điều khiển tương đương với mục đích là để bù cho các sai số mô hình và các thành phần bất định của đối tượng Trong tất cả các nghiên cứu trên, các mạng nơ-ron hoặc nơ-ron mờ được huấn luyện trực tuyến với các luật cập nhật được đề nghị khá đơn giản chủ yếu dựa trên tín hiệu hồi tiếp là tín hiệu mặt trượt. Các chứng minh về sự ổn định của hệ thống, sự hội tụ của các luật điều khiển trượt mạng nơ-ron thường dựa trên lý thuyết ổn định của Lyapunov. Đặc điểm của các phương pháp nghiên cứu này là chúng vẫn sử dụng luật điều khiển trượt cổ điển làm cơ sở. Mạng nơ-ron chỉ dùng để thay thế thành phần điều
  • 16. Hàm dấu trong thành phần điều khiển bền vững thường được thay thế bằng hàm bảo hòa để hạn chế hiện tượng chattering. Tuy nhiên các chặn trên dùng trong thiết kế thành phần điều khiển bền vững vẫn là các giá trị hằng được chọn trước, vì vậy chất lượng điều khiển vẫn phụ thuộc vào việc lựa chọn các giá trị hằng khi thiết kế thành phần điều khiển bền vững. Vì bài toán điều khiển trượt dùng mạng nơ-ron hay nơ-ron mờ không có mô hình toán học rõ ràng nên không thể áp dụng các phương pháp điều khiển trượt phân ly cổ điển [1], nên trong các tài liệu [7], [8], [9], [10] các tác giả đã đề nghị một mô hình điều khiển trượt phân ly đơn giản nhưng rất hiệu quả để kết hợp với bộ điều khiển trượt dùng mạng nơ-ron thành bộ điều khiển trượt phân ly dùng mạng nơ-ron áp dụng để điều khiển cho các hệ thống đa biến. Các kết quả nghiên cứu bằng lý thuyết cũng như mô phỏng và thực nghiệm trên nhiều đối tượng con lắc ngược, hệ cầu banh, cánh tay máy…, đã cho thấy các bộ điều khiển phân ly dùng mạng nơ-ron có khả năng điều khiển thích nghi trong những điều kiện không biết trước các hàm phi tuyến của đối tượng và có khả năng hạn chế được hiện tượng chattering. Tuy nhiên việc tách thành phần điều khiển bền vững với thành phần điều khiển tương đương hoặc việc thay thế hàm dấu bằng hàm bão hòa trong thành phần điều khiển bền vững đã làm giảm tính bền vững của hệ thống trước nhiễu ở vùng sát mặt trượt. 1.2 Mục tiêu và phương pháp nghiên cứu của luận án Mục tiêu nghiên cứu của luận án Mục tiêu luận án là phát triển các nghiên cứu về điều khiển trượt cổ điển và điều khiển trượt dùng mạng nơ-ron để thiết kế bộ điều khiển trượt thích nghi phân ly DANSMC áp dụng cho hệ phi tuyến đa biến sử dụng mạng truyền thẳng làm bộ điều khiển trực tiếp kết hợp được cả hai thành phần điều khiển tương đương và điều khiển bền vững trong điều kiện không biết trước các thông số mô hình của đối tượng và các chặn trên của các thành phần bất định hoặc hơn nữa các thông số của mô hình và các giá trị chặn trên có thể bị thay đổi trong quá trình điều khiển. Luật điều khiển trượt được nghiên cứu thiết kế theo hướng sao cho nó không chứa hàm có dấu nhằm khắc
  • 17. chattering; vừa phải bảo đảm được tính bền vững của hệ thống trước nhiễu. Ứng dụng các kết quả nghiên cứu về điều khiển trượt thích nghi dùng mạng nơ- ron lên các đối tượng phi tuyến có độ bất ổn cao như con lắc ngược xoay và con lắc ngược hai chiều. Các ứng dụng bộ điều khiển nêu trên để điều khiển ổn định hệ thực con lắc ngược xoay nhằm kiểm chứng khả năng của bộ điều khiển khi áp dụng lên các hệ thực. (Kỹ thuật điều khiển con lắc ngược dùng mạng nơ-ron có thể phát triển để điều khiển các đối tượng phi tuyến khác như rô-bốt di chuyển cân bằng trên hai bánh, tên lửa, cánh tay rô-bốt ….) Phương pháp nghiên cứu trong luận án Về lý thuyết - Nghiên cứu thiết kế một luật điều khiển trượt không có thành phần chuyển mạch. Tín hiệu phản hồi bao gồm cả tín hiệu mặt trượt và đạo hàm của nó cho phép xác định một quỹ đạo cho trước của tín hiệu mặt trượt nhằm khắc phục hiện tượng chattering. - Nghiên cứu sử dụng một mạng truyền thẳng với ngõ vào là các sai số trạng thái và ngõ ra là tín hiệu điều khiển làm bộ điều khiển trượt thích nghi. Luật cập nhật thích nghi với tín hiệu hồi tiếp bao gồm tín hiệu mặt trượt và đạo hàm của nó. Giải thuật huấn luyện mạng được xây dựng sao cho quỹ đạo pha của hệ thống hội tụ về mặt trượt theo một quỹ đạo cho trước trong điều kiện đối tượng bất định. Mạng truyền thẳng được sử dụng làm bộ điều khiển trượt thích nghi trực tiếp cho cả hai thành phần điều khiển tương đương và hiệu chỉnh. Nhờ đó mà không chỉ các thông số của mô hình đối tượng mà cả các giá trị chặn trên cũng được cập nhật đầy đủ cho thành phần điều khiển bền vững. Về ứng dụng - Cuối cùng luận án nghiên cứu kết hợp giữa điều khiển trượt dùng mạng nơ-ron với lý thuyết điều khiển phân ly để hình thành bộ điều khiển trượt thích nghi phân ly áp dụng được cho các hệ thống đa biến. Các luật điều khiển và luật cập nhật được chứng minh dựa vào các hàm điều khiển Lyapunov.
  • 18. mô phỏng trên hệ thống con lắc ngược hai bậc xoay tự do và con lắc ngược hai chiều với đầy đủ các quy trình từ huấn luyện ban đầu nhằm kiểm chứng tính hội tụ của luật cập nhật thích nghi, đến các kết quả điều khiển bám theo quỹ đạo và các kết quả thực nghiệm trên hệ thực con lắc ngược xoay nhằm kiểm tra chất lượng của bộ điều khiển trong điều kiện các thông số mô hình thay đổi liên tục và ảnh hưởng mạnh của nhiễu từ bên ngoài. Các mô phỏng dựa trên phần mềm matlab và simulink, còn thực nghiệm dựa trên nền của board xử lý tín hiệu số DSP TMS320-2812 kết hợp với phần mềm CCS (Code Composer Studio). Nội dung của luận án Luận án được chia thành bốn chương chính với các nội dung như sau: Chương một là chương tổng quan về điều khiển trượt, điều khiển trượt dùng mạng nơ-ron, mục đích cũng như phương pháp nghiên cứu của luận án. Chương hai giới thiệu các kiến thức cơ sở về mạng nơ-ron và lý thuyết điều khiển trượt, và một số mô hình điều khiển trượt dùng mạng nơ-ron. Phần đầu của chương này giới thiệu mạng truyền thẳng với đầy đủ các cấu trúc cơ bản, khả năng xấp xỉ các hàm phi tuyến và các phương pháp huấn luyện mạng. Phần tiếp theo giới thiệu lý thuyết điều khiển trượt cổ điển được đưa ra cùng một số phân tích về ưu nhược điểm. Phần cuối của chương này giới thiệu một số mô hình điều khiển trượt phân ly dùng mạng nơ-ron đã được phát triển trong những năm gần đây. Chương ba bao hàm nội dung chính của luận án. Trong chương này một bộ điều khiển trượt thích nghi phân ly dùng mạng nơ-ron DANSMC được đề nghị với luật điều khiển trượt mới không có các thành phần chuyển mạch nhằm khắc phục hiện tượng chattering. Hơn nữa, khác với các phương pháp điều khiển trượt dùng mạng nơ-ron khác được trình bày ở chương hai, mạng nơ-ron ở đây được dùng để thay thế cả hai thành phần điều khiển tương đương và điều khiển bền vững với tín hiệu hồi tiếp huấn luyện mạng bao gồm cả tín hiệu mặt trượt và đạo hàm của nó (trong khi các phương pháp khác chỉ sử dụng tín hiệu mặt trượt), có khả năng học được luật điều khiển mới và khả năng cập nhật thích nghi, tự điều chỉnh luật điều khiển phù hợp nhằm bảo đảm chất lượng điều khiển khi các thông số của đối tượng bị thay đổi. Chương bốn mô tả ứng dụng phương pháp điều khiển trượt thích nghi phân ly DANSMC được giới thiệu trong chương ba vào hai mô hình con lắc ngược hai bậc
  • 19. và con lắc ngược hai chiều là các mô hình phi tuyến cao, bất ổn và không cực tiểu pha cùng với các kết quả mô phỏng và thực nghiệm. Trong các thí nghiệm này, các mạng nơ-ron được khởi tạo với giá trị ngẫu nhiên ban đầu nhỏ, với vùng không gian trạng thái được thu hẹp xung quanh điểm cân bằng ngược, và được mở rộng dần ra, cùng với chất lượng điều khiển được tăng dần. Các mô phỏng trên con lắc hai chiều được thực hiện trong điều kiện con lắc di chuyển theo một quỹ đạo cho trước trên một mặt phẳng trong điều kiện bị tác động mạnh của nhiễu bên ngoài và sự biến thiên lớn các thông số của con lắc. Các kết quả mô phỏng trên matlab và simulink và trên thực nghiệm thông qua phần mềm CCS đã cho thấy khả năng thích nghi trước sự thay đổi của các thông số mô hình và tính bền vững của bộ điều khiển được đề nghị dưới tác động mạnh của nhiễu bên ngoài. Cũng trong chương này, một số kết quả mô phỏng điều khiển DNNSMC trên con lắc ngược xoay cũng được đưa ra nhằm so sánh với phương pháp điều khiển DANSMC. Chương năm khái quát lại sự khác biệt và các kết quả đạt được của các phương pháp nghiên cứu trong luận án so với các phương pháp nghiên cứu khác và nêu lên một số tồn tại cũng như phương hướng nghiên cứu khắc phục.
  • 20. CƠ SỞ Hình thành và phát triển từ thập niên năm mươi của thế kỷ hai mươi, điều khiển trượt đã trở nhanh chóng trở thành một trong những phương pháp kinh điển được ưa chuộng trong các phương pháp điều khiển các hệ phi tuyến. Nhờ vào tính năng giảm bậc, ít nhạy đối với nhiễu, với sự biến thiên của các thông số của đối tượng, điều khiển trượt trở thành một công cụ mạnh để điều khiển các hệ thống động học bậc cao, phức tạp dưới các điều kiện bất định của hệ thống. Các nghiên cứu lý thuyết và thực hành điển hình về điều khiển trượt cổ điển đã được trình bày đầy đủ trong các tài liệu [1], [11], [12], [13], [14]. Trong những năm gần đây nhiều công trình nghiên cứu kết hợp giữa điều khiển trượt cổ điển và điều khiển thông minh đã được công bố nhằm khắc phục một số nhược điểm còn tồn tại của điều khiển trượt cổ điển về tính tối ưu của tín hiệu điều khiển, hiện tượng chattering của các biến trạng thái xung quanh mặt trượt…, cũng như phát triển các luật điều khiển trượt mà không cần biết chính xác các thông số của đối tượng. Tổng hợp từ các nghiên cứu trên, chương này và trình bày lại một số nội dung chính, làm cơ sở để phát triển cho mô hình điều khiển trượt phân ly DANSMC sẽ được trình bày trong chương ba: - Mô hình toán học của điều khiển trượt cổ điển dưới dạng tổng quát và phát triển mô hình toán học của bộ điều khiển nhằm áp dụng cho các hệ thống phi tuyến bậc cao MIMO. - Mô hình toán học và các công thức để huấn luyện của mạng nơ-ron truyền thẳng nhiều lớp làm cơ sở để phát triển cho các mô hình điều khiển trượt dùng mạng nơ-ron và mô hình điều khiển trượt ANSMC được trình bày trong chương ba. - Một số nghiên cứu về điều khiển trượt thích nghi ứng dụng mạng nơ-ron đã được công bố trong và ngoài nước được trình bày lại theo thứ tự phát triển từ những ý tưởng nghiên cứu ban đầu tới các công trình lý thuyết và thực tiễn đã được công bố trong những năm gần đây.
  • 21. điều khiển trượt 2.1.1 Đối tượng điều khiển Xét hệ thống phi tuyến biểu diễn bởi phương trình vi phân d u y y g y y f y n n n + + = − − ). ,.,., , ( ) ,.,., ( ) 1 ( ) 1 ( ) ( (2.1) Trong đó d là nhiễu Đặt ) 1 ( 3 2 1 ... , , , − = = = = n n y x y x y x y x & & & (2.2) và T n x x x x ] ... , , [ 2 1 = ta được biểu diễn trạng thái :          + + = = = = − d u x g x f x x x x x x x n n x ). ( ) ( 1 3 2 2 1 & & M & & 1 x y = (2.3) Bài toán điều khiển được đặt ra là xác định tín hiệu điều khiển u sao cho tín hiệu ra y bám theo tín hiệu đặt r. 2.1.2 Mặt trượt Định nghĩa tín hiệu sai lệch r y e − = (2.4) và tín hiệu s e c e c e c e s n n n 1 2 ) 2 ( 1 ) 1 ( .... + + + + = − − − & (2.5) Trong đó c1, ... , cn-1, là các hệ số được chọn trước sao cho đa thức đặc trưng của phương trình vi phân sau Hurwitz (có tất cả các nghiệm với phần thực âm) 0 .... 1 2 ) 2 ( 1 ) 1 ( = + + + + − − − e c e c e c e n n n & (2.6) Nếu thực hiện được luật điều khiển sao cho s = 0, tín hiệu sai lệch e là nghiệm của phương trình (2.6). Do các nghiệm của phương trình đặc trưng của (2.6) đều nằm bên trái mặt phẳng phức, nên e(t) sẽ tiến tới 0 khi t tiến tới ∞. Phương trình s=0 xác định một mặt cong S trong không gian n chiều gọi là mặt trượt (sliding surface) S.
  • 22. ra là xác định luật điều khiển u để đưa các quỹ đạo pha của hệ thống về mặt trượt và duy trì trên mặt trượt một cách bền vững đối với các biến động của ( ) f x và ( ) g x . Vấn đề chọn lựa các hệ số cho mặt trượt S. Như đã phân tích ở trên, nếu có thể điều khiển được các trạng thái tiến tới mặt trượt (s=0), thì các tín hiệu sai lệch e sẽ tiến tới 0 khi t tiến tới ∞. Đáp ứng của các sai số trạng thái khi tiến về 0 phụ thuộc vào cách chọn lựa các hệ số cho mặt trượt. Để làm rõ điều này, chúng ta lấy một ví dụ đơn giản sau : Cho một mặt trượt được biểu diễn bằng sai số trạng thái như sau : e e c s & + = . (2.7) Để phương trình : 0 . = + e e c & Hurwitz, ta chỉ cần chọn c>0. Giả sử, ta đã tìm được các luật điều khiển sao cho s đạt tới giá trị không. Khi đó phương trình (2.7) có thể viết lại : e c e . − = & (2.8) (2.8) cho thấy e(t) có dạng hàm mũ và đạt tới giá trị lân cận 0, sau khoảng thời gian c t / 3 . 3 = ≈ τ . Một cách tổng quát, để chọn các giá trị cho các hệ số của s, cần phải chọn trước đáp ứng của sai số trạng thái theo mong muốn, chọn các cực tương ứng nằm bên trái mặt phẳng phức, từ đó suy ra các hệ số cần tìm. 2.1.3 Luật điều khiển trượt kinh điển Lấy đạo hàm (2.7), ta có: n n n n n n n n n r u x g d e c e c e c x f e c e c e c r d u x g x f e c e c e c e s − + + + + + + = + + + + − + + = + + + + = − − − − − − ). ( .... ) ( .... ). ( ) ( .... 1 2 ) 1 ( 1 1 2 ) 1 ( 1 ) ( 1 2 ) 1 ( 1 ) ( & & & & & & & & & & (2.9) Nếu chọn luật điều khiển sao cho ) ( . s sign k s − = & , 0 > k (2.10) Lúc đó 0 . < s s & nên 0 > − s khi t− > ∞ Luật điều khiển trượt cổ điển có thể tính chính xác bằng cách thay (2.10) vào (2.9) và rút u ra như sau:
  • 23. n n n r d s sign k e c e c e c x f x g u + − + + + + + − = − − & & & (2.11) Luật điều khiển trượt có tính đến các thành phần bất định Trong thực tế luật điều khiển trượt cần tính tới các thành phần bất định như nhiễu hệ thống cũng như sự biến thiên theo thời gian của ) (x f và ) (x g . Gọi ) , ( t x f ∆ , ) , ( t x g ∆ là các thành phần bất định của ) , ( t x f và ) , ( t x g của hệ thống ) , ( ) ( ) , ( 0 t x f x f t x f ∆ + = (2.12) Và ) , ( ) ( ) , ( 0 t x g x g t x g ∆ + = (2.13) Trong đó ) ( 0 x f và ) ( 0 x g là các hàm danh định của hệ thống Giả sử rằng ) , ( t x f ∆ , ) , ( t x g ∆ và nhiễu d là không tính được tại từng thời điểm nhưng có thể biết được các chặn trên và dưới cụ thể là: max ) , ( f t x f ∆ ≤ ∆ , min ) , ( g t x g ∆ ≥ ∆ , và D t d ≤ ) ( (2.14) Định nghĩa hàm V 2 1 2 V s = (2.15) Điều kiện của luật điều khiển trượt là 0 < V & (2.16) Ta có : ( ) ( ) ( ) u s g x g x g x g s u s t x g d e c e c e c r t x f s s s V n n . . ) ( . ) ( . . ). , ( ) .... ) , ( .( . min 0 min 0 1 2 ) 1 ( 1 ∆ + + ∆ + ≤ + + + + + − = = − − δ & & & & & (2.17) Trong đó : ) , ( ) ( ) ( max 0 t x x x δ δ δ + = (2.18) Với ( ) ) .... ) ( ( ) ( 1 ) ( 1 2 ) 1 ( 1 ) ( 0 min 0 0 e c e c e c r x f g x g x n n n & & & + + + + − ∆ + = − − δ (2.19) Và ( ) ( ) D f g x g t x + ∆ ∆ + = max min 0 max ) ( 1 ) , ( δ (2.20)
  • 24. khiển u được chọn sao cho 0 < V & , khi đó 0 > − s , khi ∞ > − t Từ (2.17) suy ra luật điều khiển trượt có tính đến các thành phần bất định như sau: 0 max ( ). ( ( )). ( ) ( , ). ( ( )). ( ) equivalent corrective u u u x sign g x sign s x t sign g x sign s δ δ = + = − − (2.21) Trong đó ) ( )). ( ( ). ( 0 s sign x g sign x uequivalent δ − = là thành phần điều khiển phụ thuộc vào mô hình danh định của hệ thống còn gọi là thành phần điều khiển tương đương. ) ( )). ( ( ) , .( max s sign x g sign t x ucorrective δ − = là thành phần điều khiển bền vững, còn gọi là thành phần điều khiển hiệu chỉnh có tác dụng bù cho các thành phần bất định của hệ thống và có giá trị phụ thuộc vào các chặn trên của các thành phần bất định của hệ thống. Thường thì max δ được chọn bằng một hệ số dương k với ( ) ( ) D f g x g k x + ∆ ∆ + = max min 0 ) ( 1 sup (2.22) 2.1.4 Điều khiển trượt cho hệ thống MIMO Xét một hệ thống phi tuyến MIMO ( ) ( ) x= f x +g x .u & ( ) y h x = (2.23) Trong đó [ ] 1,...., T n x x x = [ ] 1 ( ) ( ) . . ( ) T n f x f x f x = 11 22 ( 1)( 1) ( ) 0 ... 0 0 0 ( ) ... 0 0 ( ) ... ... ... ... ... 0 0 ... ( ) 0 0 0 ... 0 ( ) n m nm g x g x g x g x g x − −                 = (2.24) 1 ] [ ,...., T m u u u = (2.25) 1 ( ) [ ( ) ... ( )] T p h x h x h x = Hệ thống có bậc tương đối
  • 25. f h y x L h L h.u L h x ∂ = = + = ∂ & & ( ) 2 2 . f f g f f L h y f g u L h L L h L h x ∂ = + = + = ∂ && M ( 1) 1 m m f y L h − − = ( ) ( 1) . m m m f g f y L h L L h u − = + (2.26) Định nghĩa tín hiệu sai lệch e y r = − (2.27) Và ( 1) ( 2) 1 1 ... m m m s e c e c e − − − = + + + (2.28) Trong đó 1 c , … 1 m c − là các ma trận ( p p × ) được chọn sao cho (2.28) Hurwitz Định nghĩa 1 2 T V s s = (2.29) Luật điều khiển trượt được xác định sao cho ( ) . . . . ( ( )) T T dV V d s V s s k s diag sign s dt s dt ∂ = = = = − ∂ & & (2.30) Ta có ( ) ( 1) 1 1 ( ) ( 1) ( ) ( 1) 1 1 . ( ( )) ... . ... m m m m m m m f g f m s k diag sign s e c e c e L h L L h u r c e c e − − − − − = − = + + + = + − + + + & & & (2.31) Rút u ra ta có: ( ) ( ) ( ) 1 ( 1) ( ) ( 1) 1 1 ... . ( ) m m m g f f m u L L h L h c e c e k diag sign s − − − − = − + + + + & (2.32) (2.32) thực hiện được khi số ngõ vào bằng số ngõ ra và bằng bậc của hệ thống (m p n = = ). Trong trường hợp đó hệ thống (2.23) được gọi là hệ thống chuẩn. Trong thực tế nhiều hệ thống phi tuyến có số ngõ vào điều khiển ít hơn số bậc của hệ thống, điển hình là các hệ thống cơ khí như xe con lắc ngược hoặc con lắc ngược xoay …, lúc đó bài toán thiết kế điều khiển trượt trở nên phức tạp hơn. Trong [1], Utkin đã trình bày một số phương pháp thiết kế điều khiển trượt phân ly áp dụng được cho các hệ thống phi tuyến đa biến có số ngõ vào điều khiển ít hơn số bậc của hệ thống. Các
  • 26. dựa trên cơ sở phép đổi biến để đưa hệ thống trở về dạng chuẩn, và đã áp dụng thành công cho các hệ thống bậc bốn. 2.1.5 Đặc điểm của điều khiển trượt Hình 2-1 Tín hiệu điều khiển trượt có dạng chuyển mạch Từ mục 2.1.3 và 2.1.4 cho thấy để tính toán thành phần điều khiển tương đương của điều khiển trượt đòi hỏi phải biết đầy đủ các hàm danh định của đối tượng, và để tính toán thành phần điều khiển bền vững cần phải biết các chặn trên của hệ thống và nhiễu. Hàm dấu trong thành phần điều khiển của điều khiển trượt cổ điển tạo nên hiện tượng đảo cực trong tín hiệu điều khiển (tín hiệu điều khiển có dạng chuyển mạch) với tần số cao nhất bằng tần số lấy mẫu và cộng với hiện tượng trễ vật lý của các đối tượng được điều khiển tạo nên hiện tượng dao động của các quỹ đạo pha xung quanh mặt trượt, còn gọi là hiện tượng chattering.
  • 27. phỏng quỹ đạo pha và hiện tượng chattering Nếu hệ số k được chọn càng lớn thì tính bền vững của hệ thống càng cao, đồng thời hiện tượng chattering xuất hiện càng mạnh. Hiện tượng chattering gây ra một số hiệu ứng không mong muốn như : phát sinh sai số điều khiển; làm phát nóng mạch điện tử; mài mòn các bộ phận cơ khí; kích động các mode tần số cao không mô hình hóa làm giảm chất lượng điều khiển hoặc mất ổn định. Bài toán điều khiển trượt áp dụng cho các hệ thống đa biến cần kết hợp giữa điều khiển trượt và điều khiển phân ly. Các phương pháp này dựa trên việc phân tích mô hình toán học cụ thể của từng đối tượng và rất phức tạp. 2.2 Xấp xỉ hàm của mạng nơ-ron truyền thẳng Ánh xạ vào ra của mạng hai lớp được biểu diễn như sau: 0 0 1 1 l n i o ik h kj j k i k j u w v x v w σ σ = =     = + +         ∑ ∑ ; m i ,... 2 , 1 = (2.33) Hoặc biểu diễn dưới dạng ma trận ( ) ( ) ( ) ( ) T T T T T o h v w o h w v x b b w v σ σ σ σ = + + = u x (2.34) Mạng một lớp ẩn SHL Biểu diễn vào ra của mạng SHL
  • 28. n i ik h kj j k i k j u w v x v w σ = =   = + +     ∑ ∑ (2.35) Mạng một lớp ẩn SHL và mạng hàm cơ sở xuyên tâm RBF là hai loại mạng nơ- ron căn bản thường được dùng để nhận dạng các hàm phi tuyến hoặc được sử dụng như bộ điều khiển trực tiếp Gọi x, ur là cặp tín hiệu vào ra mong muốn của một hàm phi tuyến f . Giả sử ta muốn xấp xỉ f bởi mạng ( ) ( ) ˆ , f N = = u x x w . Định nghĩa hàm mục tiêu J như sau: 1 . 2 T = J e e (2.36) với = − r e u u . Huấn luyện một mạng nơ-ron nhiều lớp ( ) w x N , để xấp xỉ hàm f là quá trình cập nhật hiệu chỉnh lặp các tham số của mạng sao cho min − > J . Lấy đạo hàm (2.36) ta có : . . . T T d dt ∂ = = ∂ & & & J e = J e e e w w (2.37) Vì 0 J > điều kiện để min − > J khi ∞ > − t là 0 < & J nên có thể chọn . . T e µ ∂   = −   ∂   & e w w (2.38) trong đó µ là một hằng số dương Quá trình huấn luyện mạng được thực hiện trong các khoảng thời gian rời rạc. Gọi τ là thời gian lấy mẫu luật cập nhật cho w tại thời điểm k như sau ( ) ( ) . . ( ) ( ) T k k k w k η   ∂ ∆ = −   ∂   e w e (2.39) τ µ η . = được gọi là hệ số học. Áp dụng cụ thể vào mạng một lớp ẩn SHL Xét một mạng SHL như đã mô tả ở mục (2.1.2), hàm tích hợp của các nơ-ron ở lớp ẩn là hàm tuyến tính Định nghĩa:
  • 29. 1 1 1 . . . i T i n T z ij j i i i in i j n x net v x v v v v x =       = + = =       ∑ K 144 4 2444 3 M v x v x , l i ,..., 1 = (2.40) và 1 [1 ]T l = z z K z (2.41) là vector ngõ ra lớp ẩn của mạng SHL, trong đó. ( ) i i z z net σ = (2.42) Tín hiệu ngõ ra thứ s của mạng SHL [ ] { 1 0 0 1 1 1 . . T s l T s sr r s s s sl s r w l z z u w z w w w w z =       = + = =       ∑ K 144 4 2444 3 M w z (2.43) m s ,..., 1 = Viết lại dưới dạng vector 1 1 2 2 . . T T T T m m u w u w u w             = = =               M M u z w z (2.44) Công thức cập nhật cho các trọng số của nơ-ron ngõ ra ( 1) ( ) . s s s w k k η + = − ∇ w w J , m s ,..., 1 = (2.45) trong đó 0 . . . . . 1 0 T T T T T s s s s s u e e e u w                 ∂ ∂ ∂ ∂     ∇ = = = =     ∂ ∂ ∂ ∂                     M M s w J J J e z z w , m s ,..., 1 = (2.46) * số 1 trong vector cột nằm ở hàng thứ s Thay (2.46) vào (2.45), ta có
  • 30. ) . . s s s k k e η + = − w w z , m s ,..., 1 = (2.47) Viết lại dưới dạng ma trận ( 1) ( ) . . T k k η + = − w w e z (2.48) Công thức cập nhật mạng cho các trọng số của lớp ẩn ( 1) ( ) . i i s v k k η + = − ∇ v v J , l i ,..., 1 = (2.49) trong đó ( ) 1 1 0 . . . . . . . . 1 0 i i i i T T m m z j T i ji j j i j i j i z net u z e w e u z net v net σ = =         ∂ ∂   ∂ ∂ ∂ ∂ ∂   ∇ = = =       ∂ ∂ ∂ ∂ ∂ ∂ ∂             ∑ ∑ M M v J J J e x v (2.50) * số 1 trong vector cột nằm ở hàng thứ i Thay (2.50) vào (2.49), ta có 1 ( 1) ( ) . . i m i i j ji j z k k e w net σ η = ∂ + = − ∂ ∑ v v , l i ,..., 1 = (2.51) Viết lại dưới dạng ma trận 1 1 1 1 ( 1) ( ) . . . . l m m j j j jm j j z z k k e w e w net net σ σ η = =   ∂ ∂ + = −   ∂ ∂     ∑ ∑ L v v x (2.52) Các giá trị ban đầu của các trọng số của mạng thường được chọn ngẫu nhiên trong khoảng từ [-1 1]. 2.3 Một số mô hình điều khiển trượt dùng mạng nơ-ron Các luật điều khiển trượt như đã trình bày trong mục 2.1 có nhược điểm là có dạng tín hiệu chuyển mạch gây nên hiện tượng chattering xung quanh mặt trượt, đồng thời luật điều khiển đòi hỏi phải biết chính rõ một số thông số mô hình của đối tượng, thông số mô hình nhiễu công thức. Từ những năm gần đây, với sự phát triển của các kỹ thuật điều khiển thông minh, nhiều mô hình điều khiển ứng dụng các kỹ thuật điều khiển thông minh như điều khiển mờ, mạng nơ-ron, nơ-ron mờ, được nghiên cứu áp dụng vào thành phần của điều khiển trượt cổ điển thành các bộ điều khiển mờ, trượt mờ, trượt dùng mạng nơ-ron, nhằm cải thiện chất lượng của bộ điều khiển trượt. Các
  • 31. cho thấy những thành công nhất định của các bộ điều khiển trượt cải tiến trên [2]-[10], [15], [16] [17] [18] [19], [20]. Tổng hợp các nghiên cứu trên cho thấy các nội dung chính trong các nghiên cứu trên như sau: - Các kỹ thuật điều khiển thông minh được ứng dụng vào làm thành phần điều khiển tương đương với mục đích thay đổi dạng tín hiệu điều khiển trượt từ dạng chuyển mạch sang dạng tín hiệu liên tục nhằm làm giảm hiện tượng chattering của các biến trạng thái trên mặt trượt. - Ứng dụng mô hình điều khiển trượt phân ly mới kết hợp với điều khiển thông minh nhằm làm giảm độ phức tạp của việc phải tính toán mô hình điều khiển phân ly cổ điển hết sức phức tạp và phụ thuộc quá nhiều vào thông số mô hình của đối tượng. - Các mô hình điều khiển mới áp dụng thành công trên các đối tượng có tính phi tuyến cao và có tính bất định lớn như hệ con lắc đơn, con lắc đôi, hệ cầu banh … Phần tiếp theo trình bày phân loại các nghiên cứu trên theo thứ tự các nội dung đã nêu trên 2.3.1 Mô hình sử dụng mạng nơ-ron làm thành phần điều khiển tương đương Các mô hình trong mục này tổng hợp từ các nghiên cứu [2]-[6], cũng là những nghiên cứu bước đầu phối hợp giữa điều khiển trượt và điều khiển thông minh, trong đó các nghiên cứu tập trung vào việc thay thế thành phần điều khiển tương đương bằng bộ điều khiển dùng mạng nơ-ron truyền thẳng một lớp. Trong mô hình điều khiển trượt dạng này tín hiệu điều khiển trượt được phân chia như sau: - Ở vùng xa mặt trượt thành phần điều khiển hiệu chỉnh được sử dụng để hướng các trạng thái tiến về mặt trượt ) ( )). ( ( . s sign x g sign k ucorrective − = (2.53) Với k được tính theo công thức (2.22) - Ở lân cận mặt trượt thành phần điều khiển tương đương được thay thế bằng một mạng hai lớp như mô tả ở mục 2.1 dùng để điều khiển các trạng thái bám trên mặt
  • 32. của mạng chính là tín hiệu mặt trượt s. Các trọng số của mạng được cập nhật thích nghi trực tuyến sao hàm (2.15) cực tiểu. Luật cập nhật mạng dựa trên phương pháp gradient descent được triển khai theo công thức : ij ij w V w ∂ ∂ − = ∆ η (2.54) Triển khai luật cập nhật cho các trọng số của lớp ngoài cùng : ( ) j j u x s w o ij . ' . . σ η − = ∆ (2.55) Trong đó η là hằng số học, o σ là hàm tác động ngõ ra, j u là ngõ ra thứ j của mạng. Các trọng số của lớp giữa của mạng thì được cập nhật dựa trên thuật toán lan truyền ngược. Mô hình điều khiển trượt dùng mạng nơ-ron dạng này đã được nghiên cứu và triển khai thông qua mô phỏng cũng như thực nghiệm trên nhiều đối tượng phi tuyến như xe con lắc, hệ cầu banh, cánh tay robot… [2]-[5], đã cho thấy khả năng tìm được luật điều khiển tương đương của hệ thống trong điều kiện biết rõ các thông số của mô hình đối tượng. Việc chỉ sử dụng điều khiển tương đương mà thực chất là bộ điều khiển mạng nơ-ron ở vùng sát mặt trượt đã làm cho hệ thống tuy có khả năng khắc phục được hiện tượng chattering nhưng lại làm suy giảm tính bền vững của hệ thống trước các ảnh hưởng của nhiễu . 2.3.2 Mô hình điều khiển trượt phân ly dùng mạng nơ-ron Năm 2007 Lon-Chen Hung và Hung Yuan Chung ở khoa kỹ thuật điện tử đại học quốc gia Đài Loan đã giới thiệu kỹ thuật điều khiển phân ly sử dụng bộ điều khiển trượt trên cơ sở mạng nơ-ron DNNSMC (Decoupled Neural Network Sliding Mode Control) cho các hệ thống phi tuyến bậc bốn [8], [9]. Tính hiệu quả của bộ điều khiển đã được kiểm chứng thông qua việc mô phỏng trên nhiều đối tượng có tính phi tuyến cao như con lắc đơn, con lắc đôi, hệ cầu banh, ... và việc thực nghiệm thành công trên trên hệ thực xe con lắc ngược. DNNSMC có thể xem là điển hình cho các nghiên cứu gần đây về điều khiển trượt dùng mạng nơ-ron.
  • 33. Hung Lee và đồng nghiệp cũng đã giới thiệu một kỹ thuật điều khiển trượt phân ly ứng dụng mạng nơ-ron tương tự như kỹ thuật điều khiển DNNSMC, áp dụng cho hệ MIMO phát triển dựa vào thuật toán SPAS (Silmultaneous Pertubation Approximation Algorithm) Các kỹ thuật phát triển điều khiển trượt thích nghi phân ly trong các tài liệu [6]- [10] có nhiều điểm tương tự. Vì vậy, trong mục này các nghiên cứu này sẽ được tổng hợp và trình bày thống nhất lại theo ký hiệu riêng của luận án, để tiện theo dõi và bảo đảm tính thống nhất của luận án. Hệ thống điều khiển trượt phân ly Xét một hệ thống bậc bốn có dạng như sau 2 2 2 2 4 4 3 1 1 1 1 2 2 1 ). ( ) ( ). ( ) ( d u x g x f x x x d u x g x f x x x + + = = + + = = & & & & (2.56) Trong đó [ ]T x x x x x 4 3 2 1 = là vector trạng thái, 1 f , 2 f , và 1 g , 2 g là các hàm phi tuyến, 1 u , 2 u là các ngõ vào điều khiển và 1 d , 2 d là nhiễu bên ngoài. Các nhiễu được giả thiết là bị chặn: 1 1 D d ≤ , 2 2 D d ≤ . Từ (2.56) có thể lần lượt thiết kế luật điều khiển trượt cho 1 u và 2 u . Tuy nhiên trong thực tế đôi khi một hệ thống đa biến như (2.56) chỉ có một ngõ vào duy nhất (ví dụ hệ thống con lắc ngược có hai bậc tự do nhưng chỉ có một motor để điều khiển). Đây là một bài toán khó vì khi đó tín hiệu điều khiển duy nhất u được dùng để điều khiển cho cả hai đáp ứng của các trạng thái lên hai mặt trượt khác nhau. Định nghĩa tín hiệu mặt trượt thứ nhất ( ) [ ][ ] z c x c z c x x c x z x c s T T 1 12 1 2 1 1 2 1 1 1 1 − = − = + − = (2.57) Định nghĩa tín hiệu mặt trượt thứ hai 4 3 2 2 x x c s + = (2.58) Trong thiết kế bộ điều khiển trượt phân ly, điều khiển tương đương có nhiệm vụ duy trì các trạng thái trên mặt trượt. Điều khiển tương đương có thể đạt được bằng cách chọn 0 1 = s & . ( ) 1 1 1 1 2 1 2 1 1 1 . d u g f z c x c x z x c s + + + − = + − = & & & & & (2.59)
  • 34. khiển trượt phân ly được chọn với hàm Lyapunov như sau: 2 1 2 1 s V = (2.60) Lấy đạo hàm (2.60) ta có ( ) 1 1 1 1 2 1 1 1 1. d u g f z c x c s s s V + + + − = = & & & (2.61) Từ (2.61) suy ra luật điều khiển trượt bao gồm cả thành phần điều khiển tương đương và điều khiển bền vững trước nhiễu 1 . eq s u u M sign ϕ   = −     (2.62) trong đó 1 1 / g D M > Vì hàm dấu của công thức (2.62) gây nên hiện tượng chattering nên được thay thế bằng hàm bão hòa trong (2.63) ( ) 1 . s sat M u u eq − = (2.63) Như vậy trong chuyển động trượt, tín hiệu điều khiển tương đương sẽ là ( ) 1 1 1 1 2 1 1 1 ks s f z c x c g ueq + + − + − = & & (2.64) Trong đó k là hằng số dương. Mục đích của điều khiển là lái các trạng thái hệ thống về điểm cân bằng gốc. Các biến 1 s , 2 s cùng suy giảm thông qua biến tạm thời z. Phương trình (2.57) chỉ ra rằng mục đích điều khiển của u được thay đổi từ 0 1 = x , 0 2 = x thành z x = 1 , 0 2 = x (Lo & Kuo, 1998) [7]. Biến tạm thời z có thể được định nghĩa 2 . upper z s z sat z ϕ   =     , 1 0 < < upper z (2.65) Trong đó z φ là hệ số để điều chỉnh độ trơn của z . Hàm () ⋅ sat được định nghĩa ( ) ( )    < ≥ = 1 1 ϕ ϕ ϕ ϕ ϕ if if sign sat (2.66) Thiết kế bộ điều khiển trượt phân ly dùng mạng nơ-ron DNNSMC
  • 35. SHL như mô tả ở mục 2.2 được dùng để thay thế thành phần điều khiển tương đương (2.64) với ngõ vào là tín hiệu mặt trượt 1 s (xem hình 2.3) . Trong đó hàm tác động lớp ẩn có dạng ( ) 1 1 1 1 s e s − + = σ (2.67) Hình 2-3 Mạng nơ-ron một lớp ẩn trong bộ điều khiển DNNSMC Ngõ ra ( ) 1 T y w vs σ = (2.68) Luật điều khiển cho hệ thống DNNSMC như trong hình 2.13 được giả thiết là có dạng sau đây: ( ) 1 ˆ ˆ , , DNNSMC h u s w v u u = + (2.69) Trong đó DNNSMC u là điều khiển tương đương xấp sỉ, h u là thành phần điều khiển bền vững, được thiết kế để bảo đảm sự ổn định của các trạng thái dưới ảnh hưởng của các thành phần bất định. Trừ (2.69) vào (2.56), ta có : ( ) ( ) ( ) ( )( ) ( )( ) 2 1 1 1 1 1 2 1 1 . DNNSMC h eq DNNSMC h eq x f x g x u f x g x u u u c x c z g x u u u = + = + + − = − + + + − & & (2.70) Định lý 1:
  • 36. hệ thống phi tuyến động mô tả như (2.56) và mặt trượt được định nghĩa như (2.57). Cho trước một quỹ đạo trạng thái mong muốn liên tục và giới hạn, nếu luật điều khiển trượt phân ly mạng nơ-ron được thiết kế như (2.69), trong đó luật thích nghi của bộ điều khiển mạng nơ-ron được thiết kế như (2.71), (2.72), và bộ điều khiển bền vững được thiết kế như (2.74) Luật cập nhật thích nghi cho mạng để đảm bảo luật điều khiển (2.69) ở ngõ ra của mạng như sau: ( ) ∆ ∆ − = s v g sign s w . ). ( . 1 1 & & σ γ (2.71) ( )w s v g sign s v & & & ∆ ∆ ′ − = . ). ( . 1 2 σ γ (2.72) Trong đó 1 1 1 1 . s s s sat ϕ ϕ ∆   = −     (2.73) 2 s 1 s 1 x 2 x 3 x 4 x y u Hình 2-4 Hệ thống DNNSMC của Lon-Chen Hung và Hung Yuan Chung 1 φ được gọi là độ dày lớp biên. Nếu 1 1 φ < s thì 0 = = ∆ ∆ s s & , ngược lại thì ∆ ∆ = s s & và 1 1 φ − = ∆ s s . Thành phần điều khiển bền vững của bộ điều khiển DNNSMC là ( ) 1 1 1 1 1 . . . corrective s s u M sat E sign g sat ϕ ϕ     = − =         (2.74) Và luật hiệu chỉnh được đề nghị để ước lượng E là ∆ = s E . 3 γ & (2.75)
  • 37. hình điều khiển trượt phân ly dùng thuật toán SPSA Mô phỏng và thực nghiệm Điều khiển DNNSMC đã được mô phỏng trên các đối tượng con lắc ngược và hệ cầu banh, cũng như thực nghiệm trên hệ thống xe con lắc tương tự như các mô phỏng mà Kuo và Lo đã thực hiện bằng các hệ thống điều khiển trượt mờ phân ly DFSM [7]. “Các kết quả thực mô phỏng và thực nghiệm đã cho thấy đáp ứng và tính bền vững của hệ thống DNNSMC tốt hơn so với hệ thống do Kuo & Lo đề nghị “ [8],[9]. Hình 2-6 Đáp ứng góc con lắc ngược của điều khiển DNNSMC so với DFSM Tổng luận về điều khiển trượt phân ly dùng mạng nơ-ron
  • 38. trình bày lý thuyết cơ sở về mạng nơ-ron, sơ lược một số ứng dụng về nhận dạng và điều khiển ứng dụng mạng nơ-ron, điều khiển trượt cổ điển và một số phương pháp điều khiển trượt dùng mạng nơ-ron. Về mặt lý thuyết thì việc áp dụng mạng nơ-ron trong nhận dạng và điều khiển là khá lý tưởng. Tuy nhiên trong thực tế việc áp dụng mạng nơ-ron để nhận dạng và điều khiển là không dễ dàng, nhất là khi áp dụng lên các đối tượng phi tuyến động học có độ phức tạp cao. Hơn nữa bất kỳ bộ điều khiển dùng mạng nơ-ron nào đều cũng phải áp dụng một trong các phương pháp điều khiển kinh điển là cơ sở để điều khiển. Điều khiển trượt thích nghi dùng mạng nơ-ron trong những năm gần đây đã có những thành quả nhất định trong việc thay thế thành phần điều khiển tương đương bằng một mạng nơ-ron với luật cập nhật thích nghi trực tuyến cho các trọng số của mạng với tín hiệu hồi tiếp cập nhật thích nghi là tín hiệu mặt trượt mà không cần biết trước các hàm phi tuyến của đối tượng. Với việc chỉ duy trì điều khiển bền vững ở vùng xa mặt trượt hoặc thay thế hàm dấu trong thành phần điều khiển bền vững bằng hàm bão hòa đã hạn chế được hiện tượng chattering Tuy nhiên về mặt bản chất thì các luật điều khiển trượt dùng mạng nơ-ron như đã nêu trên vẫn là luật điều khiển trượt cổ điển, vì vậy các phương pháp làm hạn chế hiện tượng chattering sẽ làm giảm tính bền vững của hệ thống ở vùng sát mặt trượt và ngược lại. Bài toán điều khiển trượt phân ly với phân ly các hệ thống bậc cao thành các hệ thống con có bậc thấp hơn theo các phương pháp điều khiển trượt phân ly mà Kuo và Lo đã giới thiệu đã cơ bản giải quyết được bài toán điều khiển trượt phân ly cho các hệ thống phi tuyến bậc bốn. Tuy nhiên, khi áp dụng phương pháp trên cho các hệ thống có bậc cao hơn bậc bốn cần phải áp dụng thêm các phương pháp biến đổi khác để phân ly hệ thống thành các hệ thống con có bậc nhỏ hơn hoặc bằng bốn. Bài toán dùng mạng nơ-ron như bộ điều khiển thích nghi trực tiếp duy nhất mà không cần nhận dạng trước các thông số mô hình đối tượng và có khả năng huấn luyện trực tuyến trong quá trình điều khiển, không cần áp dụng các phương pháp thử sai là một bài toán hết sức thú vị và có nhiều ý nghĩa khi áp dụng được trong thực tiễn. Điều khiển trượt là một phương pháp điều khiển đơn giản có thể được áp dụng để làm cơ sở cho các luật điều khiển của một bộ điều khiển nơ-ron trực tiếp, với điều kiện cần phải
  • 39. tín hiệu điều khiển thành dạng hàm trơn và luật điều khiển phải thích nghi được với sự thay đổi của các chặn trên của các thành phần bất định, để có thể thống nhất các thành phần điều khiển trượt vào một bộ điều khiển duy nhất dùng mạng nơ-ron. Chương ba của luận án sẽ tiếp tục hướng nghiên cứu dùng mạng nơ-ron như bộ điều khiển thích nghi trực tiếp với các luật điều khiển trượt được cải biên theo dạng hàm trơn và phát triển thành bộ điều khiển trượt thích nghi phân ly áp dụng được cho các hệ phi tuyến đa biến.
  • 40. TRƯỢT THÍCH NGHI PHÂN LY DÙNG MẠNG NƠ- RON Phương pháp phổ biến để thiết kế một bộ điều khiển thường là nhận dạng mô hình đối tượng rồi áp dụng các phương pháp điều khiển kinh điển để thiết kế bộ điều khiển dựa trên các thông số đã nhận dạng. Các sai số do nhận dạng thường được bù bằng phương pháp điều khiển thích nghi. Chương hai đã trình bày một số phương pháp điều khiển trượt dùng mạng nơ-ron không thông qua nhận dạng đối tượng. Áp dụng thành công các phương pháp thiết kế các bộ điều khiển trực tiếp không thông qua nhận dạng, sẽ giúp đơn giản hóa quy trình và giảm chi phí thiết kế. Tuy nhiên hạn chế của các phương pháp này là mạng nơ-ron vẫn chưa thay thế hoàn toàn bộ điều khiển trượt, luật điều khiển vẫn là luật điều khiển trượt cổ điển và phải có sự lựa chọn giữa chất lượng điều khiển và việc hạn chế hiện tượng chattering. Chương này sẽ giới thiệu một bộ điều khiển trượt thích nghi phân ly mới DANSMC (Decoupled Adaptive Neural Sliding Mode Control) áp dụng được cho các hệ thống phi tuyến đa biến. Các nghiên cứu được trình bày trong chương này đã được công bố trên các bài báo [CB1]-[CB6] (Mục các tài liệu công bố của tác giả). Ý tưởng chính là sử dụng một mạng mạng nơ-ron truyền thẳng làm thành một bộ điều khiển trực tiếp. Luật điều khiển được đưa ra dựa trên cơ sở lý thuyết điều khiển trượt sao cho có thể điều khiển được các trạng thái bám theo một quỹ đạo đã được định trước trong quá trình tiến đến mặt trượt và bám chặt vào mặt trượt nhằm khắc phục hiện tượng chattering. Luật điều khiển ở đây có dạng hàm trơn thích hợp để huấn luyện cho hàm mạng nơ-ron. Trên cơ sở của lý thuyết ổn định của Lyapunov đưa ra các luật cập nhật cần thiết để huấn luyện mạng. Cuối cùng là kết hợp giữa bộ điều khiển trượt thích nghi dùng mạng nơ-ron đã nêu trên và lý thuyết điều khiển trượt phân ly để hình thành bộ điều khiển trượt thích nghi phân ly dùng mạng nơ-ron DANSMC. 3.1 Điều khiển trượt thích nghi dùng mạng nơ-ron 3.1.1 Mô tả bộ điều khiển Mô hình đối tượng và các định nghĩa về hệ thống phi tuyến như đã mô tả ở mục 2.2
  • 41. nơ-ron dùng làm bộ điều khiển Một mạng nơ-ron SHL với n ngõ vào, m nơ-ron ở lớp ẩn, 1 ngõ ra, với các trọng số có thể điều chỉnh được, như hình (3.1) được dùng làm bộ điều khiển cho hệ (2.3). Ngõ ra của mạng nơ-ron có dạng: ∑ ∑ = = = = = m i T i i m i i i E w w z w E w N u 1 0 1 0 ) . ( . . ) , ( σ (3.1) Trong đó : T in i i w w w ] ..... [ 1 = là trọng số ngõ vào của nơ-ron thứ i (i = 1..m); T m z z z ] ..... [ 1 = là ngõ ra nơ-ron lớp ẩn; T m w w w ] ..... [ 0 01 0 = là trọng số lớp ra của mạng ; Ngõ ra u của mạng cũng là ngõ vào của hệ thống (2.3) ; Ngõ vào của mạng được kết nối các ngõ ra sai số trạng thái của (2.3) T n T n e e e e e e E ] ... [ ] ... [ ) 1 ( 2 1 − = = & . Hàm tác động ngõ ra là hàm tuyến tính. Hàm tác động (.) δ ở lớp ẩn là hàm sigmoid lưỡng cực có dạng: 1 1 2 ) ( − + = −x e x σ (3.2) Bài toán ở đây là tìm ra luật cập nhật phù hợp để huấn luyện mạng N, sao cho bộ điều khiển mạng nơ-ron có thể điều khiển được s tiến tới 0 theo một đáp ứng cho trước và duy trì ổn định trên đó. 3.1.2 Luật cập nhật thích nghi để huấn luyện mạng Luật điều khiển trượt
  • 42. + + + + = − − − & (3.3) Trong đó 1 1,.., − n c c là các hằng số được chọn sao cho (3.3) Hurwitz. Định nghĩa 2 2 1 s V = (3.4) Điều kiện để 0 > − s khi ∞ > − t là 0 . ≤ = s s V & & (3.5) Nếu s sao cho: s s . ρ − = & , : ρ hằng số dương (3.6) Thì không những điều kiện (3.5) được thỏa mãn, mà đáp ứng của s sẽ có dạng hàm mũ với thời hằng là ρ τ / 1 = . Lấy đạo hàm (3.3) và sử dụng (2.3), (2.4) ta có: u x g r d e c e c e c x f e c e c e c e s n n n n n n ). ( .... ) ( .... ) ( 1 2 ) 1 ( 1 1 2 ) 1 ( 1 ) ( + − + + + + + = + + + + = − − − − & & & & & & & (3.7) Thay (3.6) vào (3.7) suy ra luật điều khiển u thỏa mãn điều kiện (3.5) là: ( ) ) ( 1 2 ) 1 ( 1 .... ) ( . ) ( 1 n n n r d e c e c e c x f s x g u − + + + + + + − = − − & & & ρ (3.8) Luật điều khiển (3.8) có dạng hàm trơn và không có thành phần chuyển mạch như trong điều khiển trượt cổ điển. Luật cập nhật thích nghi để huấn luyện mạng Định nghĩa hàm : 2 ) . ( 2 1 s s V + = & τ (3.9) Điều kiện (3.5) sẽ thỏa mãn nếu có thể tìm được luật cập nhật w & , sao cho 0 < V & Lấy đạo hàm (3.9) ) . ).( . ( s s s s V & & & & & + + = τ τ (3.10) Ta có w w u x g w w u u s s dt d s & & & & & & . ). ( . . ∂ ∂ = ∂ ∂ ∂ ∂ = = (3.11) w w u x h w w u u s s & & & . ). ( . . ∂ ∂ = ∂ ∂ ∂ ∂ = (3.12)
  • 43. τ (3.13) Lưu ý : ( ) ) 0 ( ). ( .... ) ( 0 ) ( 1 2 ) 1 ( 1 s d u x g r d e c e c e c x f s t n n n + + − + + + + + = ∫ − − τ & & & (3.14) Thay (3.11), (3.12) vào (3.10), và để ý rằng 0 < V & nếu luật cập nhật cho mạng được chọn như sau: . ( . ). ( . ( ) ( )). . ( ( )). ( . ). u w sign s s sign g x h x w u sign g x sign s s w α τ τ α τ ∂ = − + + = ∂ ∂ − + ∂ & & & (3.15) Trong đó α là hằng số dương và theo giả thiết thì 0 ) ( ≠ x g và là hàm trơn nên )) ( ( )) ( ) ( . ( x g sign x h x g sign = + τ . Thay (3.1) vào (3.15) và dùng luật chain để triển khai cho các trọng số của lớp ra: 0 1 0 . . ( ( )). ( . ). . ( ( )). ( . ). . ( ( )). ( . ). , 1... m j j j i oi i w z u w sign g x sign s s sign g x sign s s w w sign g x sign s s z i m α τ α τ α τ =   ∂  ∂   = − + = − + ∂ ∂ = − + = ∑ & & & & (3.16) Và các trọng số của nơ-ron thứ i lớp ẩn: 0 `1 1 1 . ( ( )). ( . ). . ( ( )). ( . ). . . . . ( ( )). ( . ). . . . ( ( )). ( . ). . ' . ij i i ij m n l l l il l l i ij n oi l il l u w sign g x sign s s w z u sign g x sign s s z w w z e w sign g x sign s s z w sign g x sign s s w e w α τ α τ δ α τ α τ σ = = = ∂ = − + ∂ ∂ ∂ = − + ∂ ∂     ∂ ∂         = − + ∂ ∂  = − +   ∑ ∑ ∑ & & & & & ( ) 1 2 . . 1 . ( ( )). ( . ). . 1 . , 1... 2 n l il l ij oi i j e w w sign g x sign s s w z e j n α τ =         ∂  = − + − = ∑ & (3.17) Lưu ý : ( ) ) ( 1 2 1 ) ( ' 2 x x σ σ − = , với () ⋅ σ là hàm sigmoid lưỡng cực.
  • 44. (3.16) và (3.17) với thời gian lấy mẫu là T và viết lại dưới dạng vector: z s s sign x g sign T k w k w ). . ( )). ( ( . ) ( ) 1 ( 0 0 + − = − + & τ α (3.18) ( )E z k w s s sign x g sign T k w k w i oi i i . 1 2 1 ). ( ). . ( )). ( ( . ) ( ) 1 ( 2 − + − = − + & τ α (3.19) Thay ) ( ) 1 ( ) ( 0 0 0 k w k w k w − + = ∆ , ) ( ) 1 ( ) ( k w k w k w i i i − + = ∆ , luật cập nhật huấn luyện mạng N như sau : Đối với nơ-ron ở ngõ ra : z s s sign x g sign k w ). . ( )). ( ( . ) ( 0 + − = ∆ & τ µ (3.20) Đối với nơ-ron thứ i ở lớp ẩn : E z k w s s sign x g sign k w i oi i ). 1 ).( ( ). . ( )). ( ( . ) ( 2 − + − = ∆ & τ µ (3.21) Trong đó đặt T . α µ = là hệ số học, k là thời điểm rời rạc thứ k. Trong quá trình huấn luyện các trọng số của mạng, ở vùng xa mặt trượt thì có thể chọn µ đủ lớn để giảm thời gian huấn luyện mạng, trong khi đó ở vùng sát mặt trượt thì cần hệ số µ nhỏ để điều chỉnh trơn tín hiệu điều khiển. Vì vậy (3.20) và (3.21) có thể biến đổi thành: E z k w s s sign s sat x g sign k w i i i ). 1 ).( ( ). . ( ). / ( )). ( ( . ) ( 2 0 − + − = ∆ & τ ϕ µ (3.22) và z s s sign s sat x g sign k w ). . ( ). / ( )). ( ( . ) ( 0 + − = ∆ & τ ϕ µ (3.23) Trong đó      < < − − ≤ − ≥ = 1 1 , 1 , 1 1 , 1 ) ( x x x x x sat (3.24) 0 > ϕ xác định một giá trị chặn trên của s (ϕ được chọn thông qua thử nghiệm). Khi ϕ > s thì µ ϕ µ = ) / ( . s sat , còn khi ϕ < s thì µ ϕ µ ϕ µ < = ) / .( ) / ( . s s sat . Như vậy, có thể chọn giá trị của µ đủ lớn để tăng nhanh tốc độ học cho bộ điều khiển mạng nơ- ron, mà vẫn bảo đảm độ trơn của tín hiệu điều khiển ở vùng sát mặt trượt.
  • 45. trượt thích nghi phân ly dùng mạng nơ-ron DANSMC Mô hình (2.3) là mô hình toán học chuẩn cho hệ thống phi tuyến, tuy nhiên các hệ thống thực thường có dạng biểu diễn không chuẩn. Ví dụ như xe con lắc, hay con lắc xoay lại có dạng biểu diễn : 2 2 2 4 4 3 1 ` 1 1 2 2 1 ~ ). ( ~ ) ( ~ ~ ). ( ~ ) ( ~ d u q B q f q q q d u q B q f q q q + + = = + + = = & & & & (3.25) Để có thể áp dụng luật điều khiển trượt thích nghi lên các hệ thống như (3.25), phương pháp đổi biến trong [1] được áp dụng để đưa (3.25) về dạng 2 2 2 4 4 3 1 2 2 1 ). ( ) ( ) ( d u x g x f x x x d x f x x x + + = = + = = & & & & (3.26) T x x x x x ] [ 4 3 2 1 = . Với ) ( 1 q x φ = , 3 3 q x = . ) (q ϕ được rút ra từ điều kiện : 0 . ) ( ) ( = ∂ ∂ B q q ϕ (3.27) Trong đó T q q q ] [ 3 1 = , T B B B ] ~ ~ [ 2 1 = Với phương pháp đổi biến trên điều khiển 0 > − x , tương đương với 0 > − q [1]. Tiếp tục đưa (3.26) về dạng sau 1 3 1 1 2 2 1 ). ( ) ( d x x g x f x x x ′ + + = = & & (3.28) 2 2 2 4 4 3 ). ( ) ( d u x g x f x x x + + = = & & (3.29) Giả thiết 1 f , 1 / 1 g , 1 d′, 2 d là các hàm bị chặn, thì (3.28) được xem là một hệ thống con bậc hai có ngõ vào điều khiển là 3 x . Còn (3.29) được xem như hệ thống con bậc hai có ngõ vào là u, ngõ ra là 3 x . Mục đích của bài toán: là tìm luật điều khiển u, sao cho : 0 , 0 , 0 , 0 4 3 2 1 = = = = x x x x (3.30)
  • 46. hiệu đặt cho 1 x và 3 x là 0 3 1 = = r r . Định nghĩa 2 1 1 1 . x x c s + = , 0 1 > c (3.31) Xác định một mặt trượt 1 S khi 0 1 = s . Định nghĩa hàm : 2 1 1 2 1 s V = (3.32) Lấy đạo hàm (3.32) : 1 1 1 .s s V & & = (3.33) Từ (3.31) và (3.33) ta có : ) ). ( ) ( . .( ) . .( . 1 1 1 2 1 2 2 1 1 2 2 2 1 d u x g x f x c s x x c s s s V ′ + + + = + = = & & & & (3.34) Điều kiện để 0 1 > − s , khi ∞ > − t , là 0 1 < V & , có thể chọn giá trị mong muốn của 3 x là )). ( ( ). ( . 1 1 3 x g sign s sign x z γ − = = (3.35) Với 1 1 2 1 1 )) ( . .( ) ( 1 d x f x c x g ′ + + > γ . γ là hữu hạn với giả thiết ) ( / 1 1 x g , ) ( 1 x f và 2 x bị chặn (giả thiết bị chặn trên là hợp lý với các hệ thống vật lý). Để 3 x là hàm trơn, hàm ) ( 1 s sign trong (3.35) được thay thế bằng hàm sigmoid lưỡng cực. Khi đó (3.35) trở thành
  • 47. hình điều khiển trượt thích nghi phân ly
  • 48.         − + − = − φ γ (3.36) Trong đó φ là hằng số dương, ảnh hưởng đến mức độ trơn của 3 x . Với luật điều khiển (3.2.12), điều kiện 0 1 < V & thỏa mãn nên 0 1 > − s , điều đó dẫn đến 1 x , 2 x tiến tới 0 và để ý rằng : 0 )) ( ( . 1 exp 1 2 . lim ) ( lim 1 / 0 3 0 1 1 1 =                 − + − = − > − > − x g sign x s s s φ γ (3.37) Cho thấy lúc đó 0 3 > − x . Như vậy với luật điều khiển (3.36) 1 x , 2 x , 3 x đồng thời tiến tới 0. Định nghĩa : 4 3 2 2 ) ( x z x c s + − = , 0 2 > c (3.38) Xác định một mặt trượt 2 S khi 0 2 = s . Áp dụng mạng nơ-ron như đã mô tả ở mục 3.1.1 để điều khiển tín hiệu mặt trượt 0 2 > − s . Mạng nơ-ron có ngõ vào là x , ngõ ra điều khiển u, luật cập nhật thích nghi để huấn luyện mạng là các luật (3.22) và (3.23) với 2 s s = . Mô hình điều khiển trượt thích nghi phân ly cho như ở hình 3.2. Như đã chứng minh ở mục 3.1, với bộ điều khiển trượt thích nghi như đã mô tả thì 0 2 > − s , lúc đó z x > − 3 và 0 4 > − x . Với z x > − 3 , biểu thức (3.35) được thỏa mãn. Như vậy với mô hình điều khiển trượt thích nghi phân ly như ở trên thì 1 x , 2 x , 3 x , 4 x đồng thời tiến tới 0. Kết luận Như vậy trong chương này một luật điều khiển trượt mới (3.8) đã được đưa ra bao gồm cả hai thành phần điều khiển tương đương và điều khiển bền vững, có dạng hàm trơn, không có các thành phần chuyển mạch, có khả năng khắc phục hiện tượng chattering, và có thể được thay thế bằng một mạng nơ-ron. Luật cập nhật (3.22) và (3.23) được đề nghị đã được chứng minh là có thể huấn luyện được mạng nơ-ron trở thành bộ điều khiển trượt theo luật (3.8). Tiếp đó là mô hình điều khiển trượt phân ly được giới thiệu trong mục 3.2 có thể áp dụng cho các hệ thống đa biến
  • 49. bộ điều khiển dùng mạng nơ-ron được giới thiệu trong chương hai, mà ngõ vào của mạng nơ-ron và tín hiệu hồi tiếp để cập nhật mạng là tín hiệu mặt trượt, mạng nơ-ron của bộ điều khiển DANSMC là ngõ vào trạng thái còn tín hiệu hồi tiếp bao gồm cả tín hiệu mặt trượt và đạo hàm của nó. Bộ điều khiển trượt thích nghi phân ly DANSMC được đề nghị đã được chứng minh là có khả năng tự huấn luyện thích nghi để học được các luật điều khiển trượt (3.8) phù hợp với các thông số biến động của đối tượng và ảnh hưởng của nhiễu, cũng như khả năng khắc phục được hiện tượng chattering, nên đã thỏa mãn được cả về chất lượng và tính bền vững của hệ thống so với các phương pháp điều khiển trượt dùng mạng nơ-ron đã nêu ở chương 2. Các tính chất trên sẽ được minh họa thông qua mô phỏng và thực nghiệm sẽ được trình bày ở chương 4. Một số điều cần lưu ý là khi thiết kế bộ điều khiển DANSMC thì các trọng số của mạng nên được khởi tạo với các giá trị ngẫu nhiên ban đầu nhỏ, và vùng không gian huấn luyện mạng nên được chọn ở lân cận điểm cân bằng trước khi mở rộng dần ra. Khả năng kháng nhiễu và thích nghi với các thành phần bất định của hệ thống phụ thuộc vào tốc độ lấy mẫu, với điều kiện tốc độ lấy mẫu phải nhỏ hơn hai lần tần số nhiễu lớn nhất và tốc độ biến thiên của các thành phần bất định. Với khả năng của các bộ điều khiển DSP hiện đại tốc độ lấy mẫu cỡ 1ms là hoàn toàn có cơ sở.
  • 50. MÔ PHỎNG VÀ THỰC NGHIỆM Chương này trình bày các ứng dụng của phương pháp điều khiển trượt thích nghi phân ly DASMC đã được giới thiệu trong chương ba lên các đối tượng cụ thể. Hai đối tượng được nghiên cứu ở đây là con lắc ngược xoay hai bậc tự do và con lắc ngược hai chiều 2DOF, đây là hai đối tượng có tính phi tuyến cao, bất ổn và không cực tiểu pha. Áp dụng thành công lý thuyết điều khiển lên hai đối tượng này sẽ mở ra triển vọng áp dụng thành công điều khiển DANSMC lên các đối tượng phi tuyến bất định có độ phức tạp cao khác. Nội dung trình bày ở chương này bao gồm: Giới thiệu và phân tích mô hình toán học của các đối tượng Các kết quả mô phỏng điều khiển DNNSMC trong chương hai và các kết quả mô phỏng bộ điều khiển DANSMC đã được giới thiệu trong chương ba và so sánh kết quả này điều khiển của cả hai phương pháp này lên đối tượng con lắc ngược xoay. Mô tả thực nghiệm điều khiển con lắc ngược xoay với bộ điều khiển sử dụng DSP với thời gian lấy mẫu 0,001s cùng các kết quả thu được qua phần mềm CSS. Các kết quả mô phỏng điều khiển DANSMC lên đối tượng con lắc hai chiều. Đặc biệt là kết quả mô phỏng điều khiển bám con lắc ngược hai chiều theo quỹ đạo vòng tròn trong điều kiện chịu tác động của nhiễu từ bên ngoài Các mô phỏng được thực hiện trên Matlab và Simulink còn phần thực nghiệm được thực hiện trên nền của DSP TMS320-2812. 4.1 Điều khiển trượt thích nghi phân ly con lắc ngược hai bậc xoay tự do 4.1.1 Mô tả con lắc ngược xoay Con lắc ngược xoay là con lắc có hai bậc xoay tự do và chỉ có một cơ cấu chấp hành. Cấu tạo của con lắc gồm có một motor gắn với một cánh tay xoay ngang với góc xoay α , đầu ngoài cùng của cánh tay có gắn một thanh dài (con lắc) quay tự do theo chiều thẳng đứng, với góc quay β ở vị trí dựng ngược, và θ ở vị trí quay xuống.
  • 51. hình con lắc ngược xoay Phương trình động học mô tả con lắc ở vị trí dựng lên là [1]: u K J K a J l g m J C u K a p p p p . . . . 1 1 1 1 1 1 1 1 + + − = + − = θ β α α & & & & & & (4.1) Trong đó: p a f − = 1 ; p K g = 1 ; 1 1 2 J K K g p = ; p a J K x J l g m x J C f 1 1 3 1 1 1 4 1 1 2 ) sin( . . . − + − = ap và Kp hằng số mô tả động học của mô tơ; m1 và J1 là khối lượng và quán tính của con lắc, l1 chiều dài trọng tâm con lắc; g là gia tốc trọng trường; C1 là hằng số ma sát giữa con lắc và cánh tay xoay. Các thông số của con lắc dùng trong mô phỏng: Bảng 1: Các thông số của hệ thống con lắc ngược dùng trong mô phỏng Jo=0.008591(Nms2 ); Co=0.006408(Nms/rad-1 ); J1=0.000217(Nms2 ); C1=0.000158 (Nms/rad-1 ); m1=0.100(kg); l1=0.30(m); Lo=0.137; go=9.81(m/s2 ); Ku=0.0636; Kt=0.0706; Kb=0.0707; Ra=0.9; 4.1.2 Phân tích điều khiển Mục đích của bài toán là điều khiển con lắc ổn định ở vị trí dựng ngược, với 0 = = = = β β α α & & .
  • 52. đổi biến ở mục 3.2 để đưa (4.1) về dạng chuẩn, đặt : β α 1 1 K J y − = (4.2) Lấy vi phân (4.2), kết quả là: β α & & & 1 1 K J y − = (4.3) Bài toán trở thành điều khiển sao cho 0 = = = = β β & & y y . Phương trình động học ở dạng chuẩn : u J K K J l g m a J C y J K a K gl m K C y p p p 1 1 1 1 1 1 1 1 1 1 1 1 1 1 sin . sin + +         + − − = − = β β β β β & & & & & & & (4.4) Đặt : ] [ ] [ 4 3 2 1 β β & & y y x x x x x = = ; 4 1 1 1 ) ( x K C x f = ; 3 3 1 1 1 1 sin ) ( x x K gl m x g − = ; 3 1 1 1 4 1 1 2 1 1 2 sin . ) ( x J l g m x a J C x J K a x f p p +         + − − = ; 1 1 2 ) ( J K K x g p = . Hệ thống (4.4) có thể phân ly thành hai hệ thống con nối tiếp có dạng: 3 ` 1 1 2 2 1 ). ( ) ( x x g x f x x x + = = & & (4.5) u x g x f x x x ). ( ) ( 2 2 4 4 3 + = = & & (4.6)
  • 53. hình con lắc ngược trên simulink Hệ thống thứ nhất (4.5) có ngõ ra là 1 x và ngõ vào là ngõ ra 3 x của hệ thống thứ hai. Còn ngõ vào của hệ thống thứ hai là u. Lưu ý: 0 sin ) ( 3 3 1 1 1 1 < − = x x K gl m x g với ] , [ 3 π π − ∈ ∀x , và 3 x chính là góc β . Nếu β giới hạn trong khoảng: 2 / 2 / π β π < < − , thì ) ( 1 x g giới hạn trong khoảng 1 1 1 1 1 1 1 . 63 , 0 ) ( K gl m x g K gl m − < < − . Hình 4-3 Mô phỏng điều khiển DANSMC lên con lắc ngược xoay 5 Swing up Signal 4 anfadot 3 thetadot 2 anfa(rd) 1 theta(rd) In1 Out1 Sub systemp mod 1 s Integrator3 1 s Integrator2 1 s Integrator1 1 s Integrator K (z-1) Ts z Discrete Derivative1 K (z-1) Ts z Discrete Derivative Demux pi -pi 2*pi -pi 2 noise 1 In1
  • 54. quá trình và các kết quả mô phỏng Trong luận án này con lắc ngược xoay đã được tiến hành mô phỏng theo cả hai phương pháp điều khiển DNNSMC đã được trình bày trong chương hai và phương pháp DANSMC đã được trình bày trong chương ba. Mô phỏng điều khiển DNNSMC - Thành phần điều khiển tương đương của điều khiển DNNSMC là một mạng nơ- ron truyền thẳng có một ngõ vào là tín hiệu mặt trượt và một ngõ ra cung cấp tín hiệu điều khiển. Mạng nơ-ron N có 12 nơ-ron ở lớp ẩn. - Các thông số của bộ điều khiển DNNSMC được chọn như sau 1 5 γ = ; 2 3 γ = , 3 1 γ = , 1 5 φ = . - Giá trị ban đầu của E được chọn là 0. Quá trình thực hiện mô phỏng cho thấy: - Kết quả đáp ứng của hệ thống hội tụ ngay trong phiên điều khiển đầu tiên và không thay đổi ở các phiên điều khiển sau đó. Thành phần điều khiển bền vững giữ vai trò chính trong đáp ứng của hệ thống. Việc cập nhật cho các thành phần điều khiển cần được dừng lại sau khi đã đạt các yêu cầu điều khiển, vì khả năng một số thông số của bộ điều khiển vượt quá các giá trị cho phép để mô phỏng. - Hình từ 4.5 cho thấy biên độ của tín hiệu điều khiển lớn và dao động mạnh trong quá trình quá độ. - Hình 4-6 là đáp ứng của tín hiệu trượt và các hình 4-7 và 4-8 là đáp ứng của các quỹ đạo pha của các biến trạng thái xung quanh mặt trượt, cho thấy hiện tượng dao động mạnh của các biến trạng thái khi tiếp xúc với mặt trượt. Mô phỏng điều khiển DANSMC - Điều khiển DANSMC là một mạng nơ-ron truyền thẳng có một ngõ vào là tín hiệu mặt trượt và một ngõ ra cung cấp tín hiệu điều khiển. Mạng nơ-ron N có 12 nơ- ron ở lớp ẩn nhưng có bốn ngõ vào là các ngõ vào trạng thái. Các thông số của bộ điều khiển DANSMC được lựa chọn như sau. Hệ số học 01 . 0 = µ ; 4 1 = c , 1 2 = c , 10 = ρ 4 = φ , 6 . 0 = γ . Quá trình thực hiện mô phỏng cho thấy: