Bioinformatic utils

This repository contains some scripts that could be useful for bioinformatics analysis.

Dependencies

Python3.8 or superior;
Libraries present in the requirements file.

Installation

After install the external programs, download the repository:

git clone https://github.com/Nickolaz47/bioinfo_utils.git

Enter the folder and install the python libraries:

pip install -r requirements.txt

Scripts

Sequence validator

This script aims to remove nucleotide/aminoacid sequences that have some invalid character.

Usage

python3 sequence_validator.py -fi fasta input -fo fasta output -m (n or p)

Parameters

fi: Fasta file input.
fo: Fasta file output.
m: Mode to run the script, n for nucleotide sequences and p for protein sequences.

Transcript filter

This script aims to generate a fasta file with only the longest transcript of each gene.

Usage

python3 transcript_filter.py -fi fasta input -fo fasta output -tp pattern

Parameters

fi: Fasta file input.
fo: Fasta file output.
tp: Transcript pattern used to identify a transcript from a gene. Example: gene1-transc1, transcript pattern = "-".

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
README.md		README.md
requirements.txt		requirements.txt
sequence_validator.py		sequence_validator.py
transcript_filter.py		transcript_filter.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Bioinformatic utils

Dependencies

Installation

Scripts

Sequence validator

Usage

Parameters

Transcript filter

Usage

Parameters

About

Releases

Packages

Languages

Nickolaz47/bioinfo_utils

Folders and files

Latest commit

History

Repository files navigation

Bioinformatic utils

Dependencies

Installation

Scripts

Sequence validator

Usage

Parameters

Transcript filter

Usage

Parameters

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages