All posts in General

December 6, 2023

Generative AI Hallucinations

Problem in GenAI

Sometimes Generative AI perceives patterns that are imperceptible to people leading to an inaccurate output. We are talking about GenAI hallucinations, just like humans seeing patterns in clouds in the sky.

Hallucinations are misinterpretations due to several factors including  over-fitting, bias or inaccuracy of the training data, as well as the complexity of the large language model (LLM) used.

Causes of hallucinations

Our AI team is working on reducing the occurrence of hallucinations by optimizing data pre-processing and refining model architectures.We know that Generative pre-trained transformer (GPT) still has limitations and many researchers are working to reduce hallucinations by addressing the causes including:

  • Social biases in the training data,
  • Conflicting indications,
  • Insufficient training data: model is not trained with a diverse and representative dataset, it may lack exposure to diverse scenarios and contexts,
  • Model complexity, complex models can produce unexpected results.
  • Over-fitting, model is tuned too tight,
  • Ambiguity in the training data, training data contains contradictory or ambiguous content,
  • Data Anomalies and Outliers, training data can impact the model behavior,
  • Model complexity: Very complex artificial intelligence models can sometimes produce unexpected results.
  • Non-Contextual Verification,LLMs do not possess the ability to verify information against external sources or access real-time data. 

European Ethical AI

The problems GenAI hallucinations cause are generating disinformation, providing ethical issues, and giving misleading content.

It is crucial to improve the quality of the data and algorithms and invest in research and development to make GenAI ethically sound and safe to use.

Semlab is working in close collaboration with other researchers and developers within the European industry and academia. Semlab joined R&D efforts to mitigate hallucination and maximize LLM societal benefits while minimizing bias and misleading content and working on an European Ethical AI. 

 

November 17, 2022

Innovatieproject voor geestelijke gezondheid:

Ontwikkeling van een AI-ecosysteem dat de diagnose en zorg voor psychische aandoeningen verbetert.

Met 24 partners in 5 landen introduceert Semlab als Nederlands landencoördinator dit innovatieproject, gefinancierd voor Rijksdienst voor Ondernemend Nederland in het kader van ITEA 4 (Europees cluster voor software innovatie).

Projectpartners Amsterdam Universitair Medisch Centrum, Philips NV, Technische Universiteit Eindhoven, Knowl, 5m, GGZ Oost Brabant en Semlab hebben de handen ineengeslagen om met Artificiële Intelligentie (AI) ondersteunende toepassingen te gaan ontwikkelen.

“Het Nederlandse deel is € 5,6 Miljoen”, zegt Bram Stalknecht, mede-oprichter van Semlab, “samen met deze projectpartners kunnen we AI-ondersteuning geven aan professionals in GGZ en haar cliënten.”

Wereldwijd lijden meer dan 280 miljoen mensen aan psychische aandoeningen, zoals depressie, obesitas en eetstoornissen, en dit neemt alleen maar toe met name onder jong volwassenen.

Eetstoornis is, net als depressie, moeilijk te behandelen; slechts ongeveer 50% herstelt na behandeling en zelfs na succesvolle behandeling is de terugval groot.

DAIsy zal nieuwe AI-ondersteunde oplossingen ontwikkelen voor verbeteringen op het gebied van de diagnose, selectie van de behandeling, monitoring van voeding en activiteiten, en beoordeling van de respons op de behandeling.

De Nederlandse use case richt zich op twee belangrijke psychische aandoeningen en hun wisselwerking: depressieve stoornis en eetstoornis. Voor beide ziekten zal DAIsy op AI gebaseerde tooling ontwikkelen, onderzoeken en valideren door de analyse van een breed scala van gegevensbronnen.

Het overkoepelende doel van DAIsy is om de efficiëntie, nauwkeurigheid en prognostische waarde van de behandeling van patiënten met een psychische aandoening te verbeteren.

Binnen het project zal AI worden getraind door data en expertise van Oost Brabant GGZ en Amsterdam UMC.  De ambitie is om de resultaten te delen met zorgprofessionals en een applicatie aan te kunnen bieden.
Voor meer informatie: https://itea4.org/project/daisy.html

 

January 27, 2022

AI-gedreven Uitspraakvoorspeller App ondersteund door Rijksdienst voor Ondernemend Nederland

Toegankelijke rechtspraak is een groot goed in Nederland, tegelijkertijd lopen de kosten van rechtsbijstand hoog op en zal er meer en meer beroep worden gedaan op het rechtsysteem.
Met AI kan met in een voorfase een algemene rechterlijke toets plaatsvinden waarbij relevante ‘events’ automatisch worden vergeleken met jurisprudentie dmv een artificiële intelligentie omgeving. Hiermee wordt de uitspraak voorspelt door honderdduizenden openbare zaken in onder andere rechtspraak.nl binnen een paar seconden te vergelijken met het conflict.

De applicatie zal worden gebruikt onder de beoogde afnemende organisatie MvJ&V en zal gratis toegankelijk zijn voor de burgers. Het product is intrinsiek schaalbaar en met weinig aanpassingen toepasbaar in andere rechtsgebieden, voornamelijk commerciële advocatuur en andere rechtsbijstand organisaties.

De AI zal met de nieuwe autoregressie language model van GOOGLE worden opgezet waarbij miljoenen parameters een on the fly reasoning mogelijkheid bieden om voor alle nuances in zaken toe te voegen en zo tot een juiste toetsing en oordeel te komen.

 

June 23, 2021

Semlab AI DevOps latest investment: Powerhouse Beyond State of the Art AI: Autoregressive Modeling and DeepLearning GPU Rendering Workstation

SEMLAB invests in beyond state of the art AI Development:
For our pre-training on an extremely large corpora of data and fine tuning on specific tasks SEMLAB DevOps is modelling with Autoregressive Language Models, allowing to parse over 175 billion parameters.
We improve on the fly reasoning and domain adaptation on our artificial intelligence highly autonomous systems that outperform state of the art artificial intelligence solutions at most economically valuable work.

For our Machine Learning implementation in Java agile software processes, data-driven development, reliability, and responsible experimentation we improved our
Storage frameworks including Hadoop, S3, Snowflake, Spark, Flink, Cassandra, Dynamoand Kafka and Machine Learning frameworksTensorflow, Caffe and PyTorch.
In order to process big data sets the latest NVIDIA RTX Deep learning GPU Rendering workstations will be deployed.

 

March 17, 2020

CoronaTriage wordt nu volop gebruikt

Vorige week hebben onze applicatie engineers het corona protocol van het RIVM in de Meditra triagesoftware geprogrammeerd. We zijn nu een week verder en vele eerste- en tweedelijns zorgmedewerkers gebruiken de gratis beschikbaar gestelde triagetool. We zullen deze service blijven aanbieden zolang hier behoefte aan is. Elke verandering die het RIVM maakt zullen we zo snel mogelijk verwerken zodat de gebruiker altijd de laatste inzichten heeft.

Coronatriage kunt u vinden op het volgende adres: https://coronatriage.semlab.nl/

Voor de reguliere NTS  triagesoftware ga naar: https://meditra.semlab.nl/

 

 

 

October 8, 2018

State Secretary Mona Keijzer awarded SemLab, 2.5€ Million European Innovation project

State Secretary Mona Keijzer awarded SemLab for €2,5 Million European Innovation Project.

Eurostars Awards Eurostars Awards

Eurostars, a co-funded European Union programme,  enabled SemLab to collaborate with data analytics companies across Europe. This ranged from Big Data Analytics in Sweden, Statistic Machine Translation in Latvia to Data Integration in Turkey.  SemLab integrates high valuable tools within its Artificial Intelligence software to provide innovative solutions to its customers.

 

 

November 15, 2017

Crypto Data: First Blockchain project for Reference Data.

blockchain2

SemLab is currently entering a Shared Reference Data project with distributed ledger technology, in order to simplify reference data processes. Reference data is a headache for financial instrument services, where there is a lack of coordination, legacy data systems and inefficient processes. SemLab will make the current legacy obsolete and stop the need of having own record keeping with inevitable and costly inconsistencies that need to be reconciled. The project aim is to tackle these problems through the distributed ledger prototype simulate the collaborative management of reference data, as well as the use of that data for corporate bond issuance. The project is now open for participants in the financial service industry. Data suppliers, buy- and sell side participants will be part of the project, benefit in first user experience in crypto data.

Participants could interact with reference data after issuance, with any proposed changes requiring validation by the underwriter to ensure the ledger provided a single, immutable record of all data related to the bond. The partners allowing regulators and network participants to view in real time which parties on the ledger have created, issued and proposed amendments to the data record.

The project outcome is a shared reference data platform based on disturbed ledger technology.  Results intend to demonstrate accurate and automated blockchain ref data and reduce reference data costs while improving latency and operational risks in back offices. Reference Data will be managed by one sophisticated agile system without the need of own data copies.

SemLab  is combing Artificial Intelligence and Blockchain technology to cover over 15 million financial instruments in more than 200 markets,  to improve risk management, maintain compliance with regulatory mandates and maximize operational efficiency. Artificial Intelligence, eg natural language processing, machine learning is used in text analytics in order to integrate reference content correctly.

For more participating in the first crypto-data blockchain project please contact sales@semlab.nl

 

 

November 15, 2017

Grafische vormgeving van jurisprudentie? Juribot doet het!

 

Emma Smitshuijzen, Legal Business Analyst, over de nieuwe hoge raad- interface:

Juribot, de kunstmatige intelligentie applicatie voor juristen, komt opnieuw met een innovatieve manier om jurisprudentie inzichtelijker en transparanter te maken: dit keer met een grafische interface voor referenties in Hoge Raad zaken (ook wel: de graaf). De graaf laat u de verwijzingen binnen uitspraken van de Hoge Raad zien in een interactieve grafische interface, en daarbij ook de mate van verwijzingen. Juribot™  belicht hiermee een nieuwe innovatieve kant van het gebruik van Artificiële Intelligentie (AI) binnen het juridisch vakgebied. Met het gebruik van de graaf is inzicht krijgen in de belangrijkste jurisprudentie over een bepaald onderwerp makkelijker dan ooit.

De graaf:

  • visualiseert de referenties tussen zaken van de Hoge Raad.

  • toont bij het invoeren van zoektermen alleen de zaken die matchen met uw termen.

  • geeft verschillende filtermogelijkheden om tot het beste resultaat te komen.

  • kan gezoomed en gesleept worden om naar uw wens referenties in beeld te brengen.

  • toont met verschil in grootte de mate waarin gerefereerd wordt naar een zaak.

    • hierdoor is snel in te zien wat wordt beschouwd als een kernzaak binnen een bepaald onderwerp

.

Een voorbeeld van snel inzicht is de  algemene top 5 van meest-gerefereerde strafzaken:

  1. Arrest Redelijke Termijn II (ECLI:NL:HR:2008:BD2578)

  2. Arrest Afvoerpijp (ECLI:NL:HR:2004:AM2533)

  3. Arrest Hennepkwekerij (ECLI:NL:HR:2006:AU9130)

  4. Arrest Redelijke Termijn I (ECLI:NL:HR:2000:AA7309)

  5. Arrest Post-Salduz (ECLI:NL:HR:2009:BH3079)

 

Op dit moment is de graaf in ontwikkeling op het gebied van strafrecht, maar zoals voor alle applicaties van Juribot™ geldt: ideeën en wensen van gebruikers staan voorop. Het is mogelijk om de graaf (en de andere applicaties) door te ontwikkelen tot een product dat volledig aansluit bij uw rechtsgebied of manier van werken. Denk hierbij aan het toevoegen van eigen data of het aanpassen van de filters.

 

Neemt u vooral contact met mij op bij ideeën, vragen of opmerkingen Emma Smitshuijzen, smitshuijzen@semlab.nl . Laat het me ook weten indien u geïnteresseerd bent in een vrijblijvende demonstratie van JuriBot

 

 

February 9, 2017

JuriBot – The Dutch Legal AI Predicting Criminal Trial Outcomes

Artificial Lawyer recently caught up with Bram Stalknecht, CEO of Dutch AI developer SemLab and founder of JuriBot, a legal AI litigation analysis application capable of criminal trial outcome prediction.

Stalknecht begins by explaining that JuriBot has been built by SemLab, a Dutch company that says of itself: ‘[We are] Europe’s main developers of semantic software applications. Today we have one of the largest groups of experts in Natural Language Processing (NLP), Computational Linguistics and Artificial Intelligence technologies.’

SemLab has around 45 full time staff working on AI. The company operates in several areas and has developed legal applications before, such as CrimiKaart, which allows people to track crimes committed in Holland at a very detailed level.

more

 

September 22, 2016

Who is the most successful lawyer or the most strict judge in the Netherlands?

LegalRobot ™: The First Intelligent Dutch case law machine is expected as Beta on www.semlab.nl/legalrobot this October. This web application uses Artificial Intelligence (AI) and will be offered free of charge to legal experts and lawyers. The application includes all public cases for criminal and related case law. Other case law is added in the course of this year.

The AI LegalRobot™ has analyzed the documents so you:

  • can filter out the defendant or perpetrator characteristics.
  • can search in specific sections of the document.
  • can filter by judge or lawyer.
  • can select acquittals or convictions.

This makes it possible to estimate which lawyer at which court for which type of offense is most likely to achieve an acquittal.
Legal robot mannetje v3 middel
LegalRobot ™ is registered as a trade mark in the Benelux by SemLab Ltd.