Juju

Juju is an information extraction framework.

Terms

Gram Token Sentence

Filter Weighter

Installation

Juju's Dependencies are handled with Maven (pom.xml).

SBT

Add the following lines to your build.sbt.

resolvers += "Local Maven Repository" at "file://"+Path.userHome.absolutePath+"/.m2/repository"

libraryDependencies += "fi.metropolia.ereading" % "Juju" % "0.0.1-SNAPSHOT"

Examples

A simple keyphrase extractor with default weighting (based on Wikipedia's corpus)

import fi.metropolia.mediaworks.juju.syntax.parser.DocumentBuilder;
import fi.metropolia.mediaworks.juju.document.Document;
import fi.metropolia.mediaworks.juju.extractor.keyphrase.KeyphraseExtractor;

String input = "Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc vitae dui lacus.";

Document document = DocumentBuilder.parseDocument(input, "fi"); // "en" is also available
KeyphraseExtractor extractor = new KeyphraseExtractor(document);

return extractor.process()

Calling process() will return a Map<Grams, Double>. Grams represent a word and the latter it's frequency/weight.

Name	Name	Last commit message	Last commit date
Latest commit Olli Alm init Feb 17, 2013 431ea0f · Feb 17, 2013 History 1 Commit
src	src	init	Feb 17, 2013
.classpath	.classpath	init	Feb 17, 2013
.project	.project	init	Feb 17, 2013
README.md	README.md	init	Feb 17, 2013
pom.xml	pom.xml	init	Feb 17, 2013

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Juju

Terms

Installation

SBT

Examples

A simple keyphrase extractor with default weighting (based on Wikipedia's corpus)

About

Releases

Packages

Languages

OAlm/juju

Folders and files

Latest commit

History

Repository files navigation

Juju

Terms

Installation

SBT

Examples

A simple keyphrase extractor with default weighting (based on Wikipedia's corpus)

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages