Articles of awk

Implementar la inclusión de otro file en una secuencia (leer de stdin)

Fondo Me enfrento al siguiente problema: insisto en usar m4_include([some/file.m4]) en mi file configure.ac, donde some / file.m4 contiene patrones como 'AC_INIT' y 'LT_INIT' que son necesarios para libtoolize para trabajar. En otras palabras, necesito que configure.ac sea preprocesado por m4 antes de que libtoollize lo alimente para search esos patrones. NO quiero generar configure.ac […]

Cómo replace campos de file_A con campos de file_B

Tengo un file como: {&structure_name.field, sizeof(structure_name.field), &structure_name.field, sizeof(structure_name.field), TODO }, {&structure_name.field, sizeof(structure_name.field), &structure_name.field, sizeof(structure_name.field), TODO }, {&structure_name.field, sizeof(structure_name.field), &structure_name.field, sizeof(structure_name.field), TODO }, y otro file que tiene 3 loggings con dos campos en cada línea: 123 fun1 456 sum_fun 789 multi_fun Quiero escribir un command rápido que me dará algo como a continuación: {&structure_name.123, sizeof(structure_name.123), […]

Comparando el valor en la misma columna y dirigiendo la salida a la nueva columna

Tengo mi file de input como DPortal=ECCN RemoteFile=4004_130122 0256 A02 141111 0940 29343414 11 110005 DPortal=ECCN RemoteFile=4004_130122 0256 A02 141111 2336 29843714 11 110006 DPortal=ECCN RemoteFile=4004_130122 0256 A02 141111 0940 29343214 11 110007 DPortal=ECCN RemoteFile=4004_130122 0256 A02 141111 2336 29843914 11 110009 DPortal=ECCN RemoteFile=4004_120306 1232 A03 141111 2336 7945414 11 110010 DPortal=ECCN RemoteFile=4004_130122 0256 A02 […]

Obtención de líneas únicas con cadenas coincidentes

Tengo un file de loggings de text similar a JSON con identificadores duplicates que se parecen a: {"ID":"93" , "ST":[42,77,51]} {"ID":"21" , "ST":[43,4]} {"ID":"94" , "ST":[65,11,4]} {"ID":"93" , "ST":[42,77,51,29,63]} {"ID":"73" , "ST":[21,20]} {"ID":"94" , "ST":[65,11,4]} {"ID":"77" , "ST":[87]} Intento filtrar los duplicates y siempre mantener la primera aparición de tal coincidencia. El campo ST podría […]

Analizar datos multidimensionales en párrafos

Estoy tratando de analizar datos de un informe PDF y filtrar ciertos elementos interesantes. Usando pdftotext -layout obtengo datos en este formatting como mi punto de partida: Record Info Interesting 123 apple yep orange nope lemon yep ———————————————– 456 dragonfruit yep cucumber nope ———————————————– 789 kumquat nope lychee yep passionfruit yep yam nope ———————————————– 987 […]

Recuperando secuencias Fasta utilizando información de file de la cama del file instalado localmente

Tengo un file .bed que contiene alnetworkingedor de 30000 filas para las cuales tengo las secuencias recuperadas usando el module fetch-sequences de la herramienta rsat ( http://rsat.ulb.ac.be/rsat/help.fetch-sequences.html#usage ) [Nota: esta herramienta se conecta al server cada vez para recuperar las secuencias] Ahora tengo aproximadamente 10000 subsets del mismo file de la cama orderados aleatoriamente para […]

unir y agregar según la position del personaje

Tengo un file donde necesito hacer coincidir y actualizar en function de qué número / personaje está en una position fija en un file. si el carácter en la position 586 = 5, inserte el cero "0" en el espacio 614 .. si el carácter en la position 586 = 1, inserte el cero "0" […]

Concatenar secuencias bajo un encabezado

Tengo un file como File1. Con un encabezado, por ejemplo, "> Contig1" y quiero concatenar todas las secuencias bajo el título respectivo. Archivo1: >Contig1 ACCCCATACATCCAAA NNNNNNNNNNCATACA AAAAAAAACTANNNNN ACATACAAAAA >Contig12 CCCCACAATTTTTAAA GGGGGNNNNNCATACA AGGAATTAACTANNAC GGATATA Rendimiento esperado: >Contig1 ACCCCATACATCCAAANNNNNNNNNNCATACAAAAAAAAACTANNNNNACATACAAAAA >Contig12 CCCCACAATTTTTAAAGGGGGNNNNNCATACAAGGAATTAACTANNACGGATATA ¿Puedes ayudarme con eso? ¡Aclamaciones!

Use un file de list para editar un file maestro a través de awk

todo el mundo. Tengo dos files: ports.lst y master.tbl ports.lst se ve así: hawaii-P1 hawaii-P2 hawaii-P3 losangeles-P1 losangeles-P3 master.tbl se ve así: #Site 1 Honolulu servername HAWAII-A hawaii-P1 InitFileA OutFileA otherfields servername HAWAII-A hawaii-P2 InitFileA OutFileA otherfields #servername HAWAII-A hawaii-P3 InitFileA OutFileA otherfields servername HAWAII-A hawaii-P4 InitFileA OutFileA otherfields #Site 16 Dallas servername DALLAS-A dallas-P1 […]

¿Cómo encontrar el mínimo de una columna en cada enésimo intervalos de un file, usando sed, sort, tail?

Quiero encontrar el mínimo de la quinta columna de un file en cada 12º intervalo de eso y save la línea asociada en un nuevo file. Para encontrar el mínimo de la última 12ma línea que puedo usar tail -n 12 $FILEname | sort -g -k 5,5 | head -1| awk '{print}'> tmp.out Pero, ¿cómo […]