Hi,
I have two questions about the dataframe operations in R:
-
Merging two dataframe in R based on the "Gene symbol identifier". How does the merging works when there is more than one gene symbol in the column separated by /// or ..... ? Which Gene Symbol gets picked by merging. For instance DDR1 /// MIR4640 or in another format DDR1 ..... MIR4640
-
Removing the rows with multiple genes symbols. Example of data provided below:
dput(head(GSE26378_data.matrix.nor))
structure(c(0.6756, 2.0564, 0.990533333333333, 1.252, 0.996266666666667,
0.7107, 0.9596, 1.7188, 0.925, 1.2134, 1.06933333333333, 1.75393333333333,
0.936866666666667, 1.52126666666667, 0.341266666666667, 1.21433333333333,
1.09193333333333, 0.822666666666667, 1.40113333333333, 1.26673333333333,
1.31053333333333, 1.10506666666667, 1.06953333333333, 0.541766666666667,
0.815333333333333, 0.831466666666667, 0.4028, 1.25846666666667,
0.922066666666667, 0.6774, 0.964866666666667, 0.7709, 0.404933333333333,
1.19093333333333, 0.9622, 0.655766666666667, 0.772466666666667,
1.1494, 0.246266666666667, 1.2376, 1.10593333333333, 0.627466666666667,
0.902933333333333, 0.8008, 1.017, 1.21596666666667, 1.10786666666667,
0.6652, 0.8872, 0.783, 0.749933333333333, 1.27313333333333, 0.908533333333333,
0.6245, 0.659733333333333, 0.946666666666667, 1.77033333333333,
0.923133333333333, 1.01566666666667, 1.21173333333333, 0.6548,
1.39953333333333, 1.08426666666667, 0.827766666666667, 1.14753333333333,
0.851066666666667, 0.482133333333333, 0.978033333333333, 1.9255,
0.6996, 1.12153333333333, 1.00046666666667, 1.19473333333333,
0.576266666666667, 0.282266666666667, 1.31666666666667, 1.00833333333333,
1.02413333333333, 0.780933333333333, 1.15693333333333, 0.272533333333333,
1.17853333333333, 1.05426666666667, 0.518533333333333, 1.01946666666667,
0.8346, 0.5708, 1.49526666666667, 1.07893333333333, 0.673), .Dim = c(6L,
15L), .Dimnames = list(c("DDR1 /// MIR4640", "RFC2", "HSPA6",
"PAX8", "GUCA1A", "MIR5193 /// UBA7"), c("GSM647547", "GSM647552",
"GSM647553", "GSM647565", "GSM647569", "GSM647574", "GSM647577",
"GSM647580", "GSM647560", "GSM647619", "GSM647550", "GSM647528",
"GSM647537", "GSM647616", "GSM647626")))
Thank you,
Toufiq