ebook img

Chapter 2 Fuzzy Arden Syntax PDF

203 Pages·2003·1.67 MB·English
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Chapter 2 Fuzzy Arden Syntax

Dissertation FuzzyARDEN: Representation and Interpretation of Vague Medical Knowledge by Fuzzified Arden Syntax ausgefu¨hrt zum Zwecke der Erlangung des akademischen Grades eines Doktors der technischen Wissenschaften unter der Leitung von Univ.-Prof. Dipl.-Ing. Dr. techn. K.-P. Adlassnig Abteilung fu¨r Medizinische Experten- und Wissensbasierte Systeme am Institut fu¨r Medizinische Computerwissenschaften eingereicht an der Technischen Universit¨at Wien Fakulta¨t fu¨r Technische Naturwissenschaften und Informatik von Dipl. Inform. Sven Tiffe Sven.Tiff[email protected] Wien, im Januar 2003 Zusammenfassung Die Wissensrepra¨sentation ist ein grundlegender Forschungsbereich im Gebiet der Ku¨nst- lichen Intelligenz. Ein Ansatz zur Repra¨sentation medizinischen Wissens liegt in der “Ar- den Syntax for Medical Knowledge Systems”. Mit der Arden Syntax ko¨nnen modulare Entscheidungsregeln definiert werden, deren zweiwertige Entscheidungslogik durch Algo- rithmen beschrieben wird. Medizinisches Wissen enth¨alt ha¨ufig Unsicherheiten im Sinne linguistischer Vagheit. Soll vages Wissen durch Regeln repra¨sentiert werden, welche auf bina¨ren Entscheidungen basieren, kann es in Grenzfa¨llen vorkommen, dass die Ergebnisse nicht mehr intuitiv nachvollziehbar sind. Durch Anwendung der Fuzzy Mengentheorie und der Fuzzy Logik kann vages Wissen pra¨zise repr¨asentiert und verarbeitet werden. Diese Arbeit stellt Ideen und Lo¨sungen vor, mit denen die Arden Syntax um Konzepte der Fuzzy Mengentheo- rie und der Fuzzy Logik erweitert wird, um Regeln mit inha¨renter linguistischer Vagheit ada¨quat darstellen zu ko¨nnen. Ein Grundprinzip der Fuzzy Mengentheorie, der graduelle Zugeho¨rigkeitsgrad eines Ele- mentes zur Menge, wird auf konditionale Elemente der Arden Syntax angewandt. Kon- ditionale Ausdru¨cke, die ha¨ufig Teil der Entscheidungslogik sind, nutzen normalerweise Vergleichsoperatoren, welche eine Bedingung durch vordefinierte Grenzwerte modellieren und einen Booleschen Wahrheitswert ermitteln. Durch die Erweiterung ausgewa¨hlter Vergleichsoperatoren um eine graduelle Erfu¨llbarkeit der Bedingung ergeben diese Op- eratoren in Grenzfa¨llen einen unscharfen, mehrwertigen Wahrheitswert. So ko¨nnen Wis- senskonzeptemitvagemDefinitionsbereichdurch“unscharfe”Vergleicherepra¨sentiertwer- den. Die sich aus der Nutzung unscharfer Wahrheitswerte ergebenden Probleme von ‘Fuzzy Algorithmen’ werden behandelt und durch eine funktionale Erweiterung von Entschei- dungselementen der Arden Syntax sowie durch eine Erweiterung des Datenmodells gelo¨st. Die Einbindung des Konzeptes ‘linguistischer Variablen’ schliesst die Erweiterungen der Arden Syntax ab. Variablen dieses Typs abstrahieren die Beziehungen zwischen linguis- tischen Ausdru¨cken und numerischen Messwerten und ko¨nnen den intuitiv lesbaren Anteil der Entscheidungslogik erho¨hen. DievorgestelltenErweiterungenwerdenineinerJavabasiertenArdenSyntax‘rulesengine’ implementiert, welche “fuzzifizierte” Arden Syntax Regeln lesen und ausfu¨hren kann. Die ‘rules engine’ wurde in zwei klinischen Projekten verwendet. Die Wissensbasis des Ex- pertensystems CADIAG-II zur Unterstu¨tzung der Differentialdiagnostik in der internen Medizin wurde erfolgreich in Fuzzy Arden repra¨sentiert. Ein Fuzzy Control basierter Klassifizierer zur Erkennung von Glaukom wurde durch Verwendung von linguistischen Variablen implementiert. Abstract The representation of knowledge is one of the fundamental research areas in the realm of artificial intelligence. One approach to this subject was provided by the Arden Syntax for Medical Logic Systems. The Arden Syntax is a hybrid knowledge representation format that allows one to define rules as single modules that use algorithms in their conditional part. It includes typical procedural programming language elements used to define a crisp decision logic based on binary decisions. However, medical knowledge usually contains uncertainty in terms of linguistic fuzziness. If such knowledge is represented by rules that require binary decisions, the results of the rules might be unintuitive when they touch borderline cases. As such uncertainty can be preciselyrepresentedandmanipulatedbyconceptsoffuzzysettheoryandfuzzylogic, this thesis presents ideas and solutions for extending Arden Syntax by concepts of fuzzy set theory, fuzzy logic, and fuzzy control to adequately represent rules with inherent linguistic uncertainty. Fuzzy sets define a gradual degrees of membership of their elements to the set instead of crispones. Thisprincipleisappliedtoconditionalexpressionsthatarepartofthedecision logic: Such expressions usually include comparison operators that compare a fact to pre- defined thresholds. With traditional Arden Syntax these conditional expressions return a Boolean truth value; by applying the concept of a gradual degree of membership (or, in other words, a gradual degree of compatibility of the fact to the condition) to a subset of the comparison operators, the conditional expressions return in borderline cases fuzzy truth values instead of crisp ones. By this, fuzzily defined concepts can be represented by fuzzified comparisons. The definition of fuzzy truth values has an impact on the algorithmic elements of the Arden Syntax, as operations, such as branches in program flow, may depend on a truth value that is neither ‘true’ nor ‘false’. The problem of fuzzy algorithms is addressed and resolved by extending the functionality of the corresponding statements and by extending the data model of the Arden Syntax. As further extension, the thesis proposes a new type of Arden Syntax module, the ‘linguistic variable’ module. This type defines the relationship of linguistic concepts to real-world facts and can be used to increase the amount of intuitively readable parts of the decision logic in an Arden Syntax module or to realize fuzzy control knowledge bases. All extensions have been realized by a Java based Arden Syntax rules engine that is able to read and execute the fuzzified Arden Syntax modules. It has been used for two clinical projects: The knowledge base of the existing expert system CADIAG-II for diagnostic decision support in internal medicine has been successfully realized by Fuzzy Arden. The syntax has been also used to realize a fuzzy control based glaucoma classifier. Contents List of Figures iv List of Tables vi Acknowledgements vii 1 Introduction 1 1.1 Knowledge representation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.1.1 Predicate logic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.1.2 Semantic nets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.1.3 Frames and inheritance systems . . . . . . . . . . . . . . . . . . . . . 10 1.1.4 Production rules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.1.5 Usability aspects of representation formats in clinical context . . . . 12 1.2 Representing uncertain knowledge . . . . . . . . . . . . . . . . . . . . . . . 13 1.2.1 Sources of uncertainty . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.2.2 Historical roots of the formalization of vagueness in natural language 14 1.2.3 Vague categories and their elements . . . . . . . . . . . . . . . . . . 16 1.3 Fuzziness theories . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.3.1 Fuzzy set theory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.3.2 Linguistic variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.3.3 Fuzzy control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.3.4 Fuzzy algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1.4 The Arden Syntax for Medical Logic Systems . . . . . . . . . . . . . . . . . 28 1.4.1 General aspects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 1.4.2 Arden in use . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 1.4.3 Current state . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 i ii CONTENTS 2 Fuzzy Arden Syntax 35 2.1 Elements of the Arden Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.1.1 Data types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.1.2 Logic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.1.3 Programming language . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.2 Conceptual models of the extensions . . . . . . . . . . . . . . . . . . . . . . 42 2.2.1 Fuzzyoperators: fuzzysetsandfuzzytruthvaluesasmodelforfuzzy comparisons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.2.2 Fuzzy data: effects of conditional contexts on algorithmic elements . 44 2.2.3 Default ‘degree of presence’ handling . . . . . . . . . . . . . . . . . . 50 2.3 Definition of the extensions . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 2.3.1 Fuzzy data model . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 2.3.2 Fuzzy operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 2.3.3 Crisp operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 2.3.4 Statements for program flow control . . . . . . . . . . . . . . . . . . 64 2.4 Linguistic variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 2.4.1 Initialization of linguistic variable MLMs . . . . . . . . . . . . . . . 78 2.4.2 Use of linguistic variables by common MLMs . . . . . . . . . . . . . 80 3 Application of methods 84 3.1 Design and implementation of the rules engine . . . . . . . . . . . . . . . . 84 3.1.1 Java class model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 3.1.2 Runtime processes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 3.1.3 Design of the interfaces . . . . . . . . . . . . . . . . . . . . . . . . . 93 3.1.4 Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 3.2 CADIAG-II/RHEUMA+Arden . . . . . . . . . . . . . . . . . . . . . . . . . 100 3.2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 3.2.2 Pre-processing of the input files . . . . . . . . . . . . . . . . . . . . . 106 3.2.3 Creation of the MLMs: highly modular approach . . . . . . . . . . . 107 3.2.4 Creation of the MLMs: compact knowledge base . . . . . . . . . . . 112 3.2.5 Report generation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 3.2.6 Helper MLMs and interfaces . . . . . . . . . . . . . . . . . . . . . . 121 3.2.7 New operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 3.2.8 Acknowledgements . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 3.3 Glaucoma monitoring . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 3.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 3.3.2 Creation of the MLMs . . . . . . . . . . . . . . . . . . . . . . . . . . 126 CONTENTS iii 4 Results and discussion 129 4.1 General aspects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 4.1.1 Fuzzy comparisons as model of vague categories. . . . . . . . . . . . 130 4.1.2 Use of fuzzy conditional statements. . . . . . . . . . . . . . . . . . . 131 4.1.3 Native extension of the syntax versus use of MLM library . . . . . . 132 4.2 Implementation of a rules engine . . . . . . . . . . . . . . . . . . . . . . . . 134 4.2.1 Compilation of Medical Logic Modules . . . . . . . . . . . . . . . . . 134 4.2.2 Java class model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 4.2.3 Performance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 4.2.4 Event handling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 4.2.5 MLM authoring . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 4.3 CADIAG-II/RHEUMA+Arden . . . . . . . . . . . . . . . . . . . . . . . . . 142 4.3.1 Performance and readability . . . . . . . . . . . . . . . . . . . . . . . 142 4.3.2 Inference results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 4.4 Glaucoma monitoring . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 4.4.1 Medical aspects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 4.4.2 Technical aspects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 5 Conclusion 154 A Bibliography 158 B Fuzzy Arden Syntax BNF 164 B.1 Changes in the BNF for Fuzzy Arden without linguistic variables . . . . . . 164 B.2 Further changes in the BNF for Fuzzy Arden including linguistic variables . 166 C Cadiag-II 169 C.1 Implication operator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 C.2 Inference operator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 C.3 Post-processing of radiological findings . . . . . . . . . . . . . . . . . . . . . 172 C.4 Ratings: differences to printout . . . . . . . . . . . . . . . . . . . . . . . . . 174 C.5 Result XML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 C.5.1 DTD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 C.5.2 XSLT stylesheet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 C.5.3 Benchmark MLMs . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 D MLM XML representation (DTD) 187 E UltraEdit syntax highlighting scheme 189 List of Figures 1.1 Model of the architecture of a knowledge-based system (following [Bib93]) . 3 1.2 Sources of uncertainty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.3 Process of abstraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.4 Characteristic function of the set of real numbers which are greater than 18 20 1.5 Parameterizable s-/z-type compatibility function . . . . . . . . . . . . . . . 21 1.6 Parameterizable linear compatibility function . . . . . . . . . . . . . . . . . 22 1.7 Fuzzy sets for “child” and “adult” . . . . . . . . . . . . . . . . . . . . . . . 22 1.8 Fuzzy union, intersection, and complement by using equations 1.14 to 1.16 . 23 1.9 Linguistic variable ‘IOP’ (intraocular pressure) . . . . . . . . . . . . . . . . 24 1.10 Structure of fuzzy control rule sets . . . . . . . . . . . . . . . . . . . . . . . 25 1.11 Reaction of production rules for a given numerical input value . . . . . . . . 25 2.1 Sample MLM: contraindication alert (taken from [Hls99]) . . . . . . . . . . 36 2.2 Membership function of a fuzzified ‘is within to’ operator . . . . . . . . . . 44 2.3 Conditional context . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.4 Selection of test results from a previous period . . . . . . . . . . . . . . . . 48 2.5 Fuzzy operator: compatibility function ’is equal’ . . . . . . . . . . . . . . . 53 2.6 Fuzzy operator: compatibility function ’is not equal’ . . . . . . . . . . . . . 53 2.7 Fuzzy operator: compatibility function ’is less than’ . . . . . . . . . . . . . 54 2.8 Fuzzy operator: compatibility function ’is less than or equal’ . . . . . . . . 54 2.9 Fuzzy operator: compatibility function ’is greater than’ . . . . . . . . . . . 55 2.10 Fuzzy operator: compatibility function ’is greater than or equal’ . . . . . . 55 2.11 Fuzzy operator: compatibility function ’is within to’ . . . . . . . . . . . . . 56 2.12 Fuzzy operator: compatibility function ’is within preceding’ . . . . . . . . . 56 2.13 Fuzzy operator: compatibility function ’is within following’ . . . . . . . . . 57 2.14 Fuzzy operator: compatibility function ’is within surrounding’ . . . . . . . . 58 2.15 Fuzzy operator: compatibility function ’is within past’ . . . . . . . . . . . . 58 2.16 Fuzzy operator: compatibility function ’is within same day as’ . . . . . . . . 59 2.17 Fuzzy operator: compatibility function ’is before’ . . . . . . . . . . . . . . . 59 iv

Description:
thesis presents ideas and solutions for extending Arden Syntax by concepts of fuzzy set theory, fuzzy logic .. 4.3 Example MLM representation by Java object tree . 1.1 Lukasiewicz first three-valued logical operators truth-tables .
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.